Reward-Guided Speculative Decoding (RSD)开源 – 提升LLM推理效率的框架
RSD是一种创新框架,通过结合轻量级草稿模型、强大目标模型和过程奖励模型,动态优化大型语言模型(LLMs)在推理任务中的计算成本与输出质量平衡。该框架在处理复杂推理任务时效率可达目标模型的4.4倍,准确率平均比并行解码方法高3.5%,特别适合资源受限环境。项目基于Qwen2.5-Math和Skywork-o1-PRM等开源模型构建,支持在线(需3个GPU)和离线(需1个GPU)两种运行模式。