数学推理 | AI-magic

预算强制策略：提升语言模型推理性能的新方法

本文探讨了一种简单且资源高效的测试时扩展方法，旨在提升语言模型的推理性能。通过“预算强制”策略，控制推理过程中的计算资源，显著提升了模型的推理准确性...

AI快讯

3个月前

本文探讨了一种简单且资源高效的测试时扩展方法，通过“预算强制”策略控制推理过程中的计算资源，显著提升语言模型的推理性能。研究在s1K数据集上验证了该方法...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。通过强化学习技术训练，该模型在多个基准测试中表现出...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练，并在AIME 2024等基准...

AI快讯

3个月前

DeepSeek-R1 是由中国深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。通过强化学习技术，该模型在多个基准测试中表现出色，性能...

AI快讯

3个月前

MetaGPT团队推出的Data Interpreter功能，被誉为“开源Devin”，能够处理数据实时变化、复杂任务依赖关系及流程优化需求。该功能在数据分析、机器学习模型构建...

AI快讯

3个月前

DeepSeek-Math模型作为国产AI大模型的代表，凭借其卓越的数学推理能力和开源生态，迅速在全球AI领域崭露头角。本文深入探讨了DeepSeek-Math的技术优势、市场...

AI快讯

3个月前

DeepSeek-R1作为一款基于强化学**习的AI推理模型，在AIME 2024等数学测试中展现了卓越性能。其无需教师数据即可实现自我进化，解决了传统AI模型的重复性和可...

AI快讯

3个月前

DeepSeek AI发布的DeepSeek-R1模型在数学、代码和推理任务上表现出色，无需SFT直接通过RL训练，解决了重复性和可读性问题，并能够将推理能力传授给小模型。在...

AI快讯

3个月前

DeepSeek发布的DeepSeek-R1模型，通过强化学**实现了无需教师数据的AI推理能力，在数学、代码和逻辑任务中表现卓越。其创新性在于低成高效、开放源码，并在AI...

AI快讯

3个月前