AI-magic AI-magic AI-magic AI-magic
  • 热门推荐
  • AI工具导航
    • AI工具
    • AI对话工具
    • AI写作工具
    • AI提示工具
    • AI办公工具
    • AI图像工具
    • AI音频工具
    • AI视频工具
    • AI设计工具
    • AI编程工具
    • AI学习网站
    • AI开发框架
    • AI其他工具
  • 开源导航
    • AI开源项目
    • 开源项目
  • 工具站导航
  • AI教程
  • AI百科
  • AI书籍
  • AI资源
  • AI快讯
  • 网站提交
AI-magic AI-magic
  • 首页
  • 黑洞
  • 导航主题
  • 图标

    数学推理效率提升

    Token 混合论文 – 混合潜在与文本Token提升推理效率
    Token 混合论文 – 混合潜在与文本Token提升推理效率

    该项目提出了一种通过混合潜在Token(由VQ-VAE生成)和文本Token来优化语言模型推理过程的方法。传统链式思维(CoT)数据因冗长的文本Token导致计算资源消耗大,而该方法通过抽象初始推理步骤为潜在Token,显著缩短推理痕迹长度(平均减少17%),同时在数学和逻辑推理任务中性能优于基线模型(如Math、GSM8K等数据集)。支持从头训练模型或微调现有LLMs,适用于数学推理、迷宫问题求解等场景。

    0
    VQ-VAE潜在Token数学推理效率提升计算资源节省语言模型推理优化
    Reward-Guided Speculative Decoding (RSD)开源 – 提升LLM推理效率的框架
    Reward-Guided Speculative Decoding (RSD)开源 – 提升LLM推理效率的框架

    RSD是一种创新框架,通过结合轻量级草稿模型、强大目标模型和过程奖励模型,动态优化大型语言模型(LLMs)在推理任务中的计算成本与输出质量平衡。该框架在处理复杂推理任务时效率可达目标模型的4.4倍,准确率平均比并行解码方法高3.5%,特别适合资源受限环境。项目基于Qwen2.5-Math和Skywork-o1-PRM等开源模型构建,支持在线(需3个GPU)和离线(需1个GPU)两种运行模式。

    0
    大型语言模型推理优化开源LLM加速框架数学推理效率提升
    Monica图标

    通过字节跳动免费使用满血可联网DeepSeek R1

    现在注册,立即送145元代金券

    字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型

    马上试试
    AI-magic AI-magic
    AI-magic收录了大量国内外AI工具箱,包括AI写作、图像、视频、音频、编程等各类AI工具,以及常用的AI学习、技术、和模型等信息,让你轻松加入人工智能浪潮。
    Copyright © 2025 AI-magic 浙ICP备19008543号-3 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!