Token 混合论文 – 混合潜在与文本Token提升推理效率

该项目提出了一种通过混合潜在Token（由VQ-VAE生成）和文本Token来优化语言模型推理过程的方法。传统链式思维（CoT）数据因冗长的文本Token导致计算资源消耗大，而该方法通过抽象初始推理步骤为潜在Token，显著缩短推理痕迹长度（平均减少17%），同时在数学和逻辑推理任务中性能优于基线模型（如Math、GSM8K等数据集）。支持从头训练模型或微调现有LLMs，适用于数学推理、迷宫问题求解等场景。

Token 混合的特点:

1. 混合潜在Token与文本Token表示推理过程
2. VQ-VAE生成潜在Token以抽象初始推理步骤
3. 训练时随机混合两类Token以加速模型适应
4. 推理痕迹长度平均减少17%，计算效率提升
5. 在Math、GSM8K等基准测试中性能显著超越基线
6. 支持模型微调和从头训练两种应用模式

Token 混合的功能:

1. 数学推理任务（如GSM8K、高考数学题）
2. 逻辑推理问题（如ProntoQA、ProsQA）
3. 合成任务（如钥匙寻找迷宫）
4. 资源受限环境下部署高效推理模型
5. 需要平衡性能与计算成本的LLM应用场景

相关导航

Reward-Guided Speculative Decoding (RSD)开源 – 提升LLM推理效率的框架

RSD是一种创新框架，通过结合轻量级草稿模型、强大目标模型和过程奖励模型，动态优化大型语言模型(LLMs)在推理任务中的计算成本与输出质量平衡。该框架在处理复杂推理任务时效率可达目标模型的4.4倍，准确率平均比并行解码方法高3.5%，特别适合资源受限环境。项目基于Qwen2.5-Math和Skywork-o1-PRM等开源模型构建，支持在线(需3个GPU)和离线(需1个GPU)两种运行模式。

flux开源项目 – 提升大模型训练效率的开源技术

Flux 是字节跳动开源的 MoE 架构优化技术「COMET」，旨在通过细粒度的计算与通信重叠来提高混合专家模型（MoE）的执行效率。该技术显著提升了模型训练的速度，降低了计算成本，并已在万卡集群中实战应用，累计节省了数百万 GPU 小时。Flux 完美兼容 DeepSeek DualPipe 方案，支持多种硬件环境稳定运行，且无需框架重构，即插即用。

openai开源项目 – gpt4

这个开源项目免费提供了通过逆向多个来源网站提供的gpt4/gpt3.5接口，涉及机器学习方面的技术。

snake-diffusion开源项目 – 利用AI技术重塑经典贪吃蛇游戏

snake-diffusion是一个基于扩散模型的贪吃蛇游戏实现，展示了如何利用扩散模型构建实时游戏。它结合了经典贪吃蛇玩法与AI技术，为玩家提供创新的游戏体验。该项目支持多种游戏模式，具有低训练成本，适合学习和实验。

MLOps Python Package开源项目 – 支持MLOps项目的灵活高效工具

灵活、健壮和高效的Python软件包，用于支持MLOps(机器学习运维)项目，提供多种工作流支持，优化性能，加速模型部署和监控，易于与其他工具集成，同时提供用户友好的API，确保模型和数据集的版本控制。

Codemcp开源项目 – Claude桌面版代码助手

Codemcp是专为Claude Desktop设计的代码助手，旨在通过消除手动复制粘贴代码的需求来简化编码流程。它支持任何开发环境，且具有高安全性和代码回滚能力。

MindGenie官网 – 智能任务管理助手

MindGenie是一个利用人工智能工具，战略性地估算任务持续时间，将耗时任务拆分为可管理的子任务，并无缝整合到日历中，以实现顺畅的工作流程。

GRAVITI Diffus官网 – 无GPU用户的AI艺术平台

GRAVITI Diffus是一个用户友好的Stable Diffusion WebUI平台，允许没有GPU或编码技能的用户轻松探索和创建AI生成的艺术作品，提供丰富的功能和社区支持。

ML YouTube Courses开源项目 – 机器学习资料汇总

机器学习的资料汇总，涉及 NLP、深度学习、LLMOps、ML数学等主题，适合不同水平的学习者，集中整理了优质的学习资料。

Drawerrr官网 – 智能分析简历与作品集，连接理想职位

Drawerrr是一个AI驱动的平台，能够分析用户的作品集和简历，将其与期望的职位匹配，并为用户提供相关的工作机会。用户只需上传自己的作品集和简历，AI算法会评估用户的技能，并与目标职位的要求进行对比，随后呈现出适合用户的工作机会列表。

φ-Decoding开源 – 优化大型语言模型推理的算法

φ-Decoding 是一种专为大型语言模型（LLM）设计的推理优化算法，通过自适应前瞻采样实现探索与利用的平衡。它将解码定义为前瞻采样，模拟未来步骤以估计全局最优步骤，并结合步骤优势和对齐评估，构建步骤值估计函数。通过宽度内和深度内剪枝策略，φ-Decoding 实现了自适应计算分配，显著提高了推理效率。在多个基准测试中，φ-Decoding 在性能和效率方面均优于自回归 CoT、Tree-of-Thoughts 和 MCTS 等基线方法，并展示了在各种 LLM 上的泛化能力。

PastaGPT官网 – 为意大利人设计的AI聊天机器人

PastaGPT是一个基于GPT-4的AI聊天机器人，旨在为意大利用户提供独特的互动体验，具备即时响应能力，适用于多个领域的支持和指导。

Vision-R1开源项目 – 强化学习提升多模态推理

Vision-R1是首个探索如何有效利用强化学习（RL）提升多模态大语言模型（MLLM）推理能力的项目。通过冷启动初始化和RL训练，该项目显著提升了模型的推理能力，并仅用7B参数实现了与70B+参数模型相当的性能。此外，Vision-R1还提供了完整的推理流程和代码，助力研究者快速上手。

MyoSuite开源项目 – 基于肌肉骨骼模型的仿真环境

MyoSuite是一个集合，包含使用MuJoCo物理引擎仿真的肌肉骨骼模型任务，并与OpenAI gym API兼容，适用于强化学习和机器学习研究。

Alpha-GPT论文 – 人机交互量化投资因子挖掘系统

Alpha-GPT是一个基于大语言模型（LLM）的量化投资研究工具，专注于通过人机交互挖掘有效的alpha因子（交易信号）。该项目提出了一种创新的提示工程框架，允许量化研究人员输入交易想法，系统会自动生成具有创造性和高收益潜力的因子表达式。通过结合LLM的少样本学习能力和启发式理解，显著降低了传统因子挖掘的人力成本，并提高了因子生成的效率和质量。

暂无评论

暂无评论...