一个强化学习项目,旨在通过少量示例训练大型语言模型以进行数学推理和解决问题。该项目通过使用少量数据和简化的训练流程,使得AI推理训练更加高效,且小模型也能表现出强大的推理能力。
Abel是一个专注于数学领域的生成式AI模型,旨在在代数和分析领域取得突破性成就,通过最新的SOTA技术为用户提供高效的数学问题解决方案。
"Claude 3"是为工作相关任务特别设计的下一代人工智能工具,强调其在操作中的安全性和准确性。这个先进的AI系统通过claude.ai访问,提供了一个多功能平台,用户可以利用各种功能,包括图像分析和处理长文档。
photomath.app是一款强大的数学帮助应用,用户可以通过扫描或输入数学问题来获取详细解答和步骤,从而帮助理解数学作业和学习数学概念。
Reasoning Gym是一个用于训练推理模型的Python库,能够生成无限多的推理任务,旨在通过强化学习提升模型的逻辑和算法推理能力。该项目支持多种推理数据集,易于集成和扩展,以满足研究和开发的需求。
这篇论文探讨了如何评估大模型的性能,包括评估的内容、地点和方法,并分析了当前评估方法的有效性和可信度。
论文讨论如何复现OpenAI的o1模型,聚焦于策略初始化、奖励设计、搜索和学习等关键组成部分,探索其在复杂任务上的应用和表现。
大型语言模型的数据、模型和基准集市,为ChatGPT的大众化贡献力量
截至目前,国内已经有了个 188 大语言模型,LLMs-In-China 收录了中国境内的多种大语言模型信息,提供模型的基本参数和性能指标,包含模型的使用案例和应用场景,并支持用户提交新的模型信息。
FeatUp 是一个与任务和模型无关的框架,用于恢复深层特征中丢失的空间信息,能够将任何模型特征的空间分辨率提高16-32倍,而无需改变其语义。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型