Dynasor 是一个基于 vLLM 的扩展,旨在通过动态执行和提前停止技术,显著加速大型语言模型(LLM)的推理过程,而无需进行额外的训练或微调。它提供了 CLI 界面和 OpenAI 兼容服务器,使用灵活,适用于多种推理场景。