标签:数学推理

预算强制策略:提升语言模型推理性能的新方法

本文探讨了一种简单且资源高效的测试时扩展方法,旨在提升语言模型的推理性能。通过“预算强制”策略,控制推理过程中的计算资源,显著提升了模型的推理准确性...

测试时扩展:提升语言模型推理性能的新方法

本文探讨了一种简单且资源高效的测试时扩展方法,通过“预算强制”策略控制推理过程中的计算资源,显著提升语言模型的推理性能。研究在s1K数据集上验证了该方法...

DeepSeek-R1:高性能AI推理模型的数学与代码推理能力解析

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。通过强化学习技术训练,该模型在多个基准测试中表现出...

DeepSeek-R1:AI推理模型的新标杆,AIME 2024中的卓越表现

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练,并在AIME 2024等基准...

DeepSeek-R1 与 o1-mini:AI 推理模型的巅峰对决

DeepSeek-R1 是由中国深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。通过强化学习技术,该模型在多个基准测试中表现出色,性能...

MetaGPT推出Data Interpreter:开源Devin的无限可能

MetaGPT团队推出的Data Interpreter功能,被誉为“开源Devin”,能够处理数据实时变化、复杂任务依赖关系及流程优化需求。该功能在数据分析、机器学习模型构建...

DeepSeek-Math模型:国产AI大模型的数学推理之光

DeepSeek-Math模型作为国产AI大模型的代表,凭借其卓越的数学推理能力和开源生态,迅速在全球AI领域崭露头角。本文深入探讨了DeepSeek-Math的技术优势、市场...

DeepSeek-R1:AI推理领域的革命性突破与AIME 2024的卓越表现

DeepSeek-R1作为一款基于强化学**习的AI推理模型,在AIME 2024等数学测试中展现了卓越性能。其无需教师数据即可实现自我进化,解决了传统AI模型的重复性和可...

DeepSeek AI:颠覆AI开发的新星与DeepSeek-R1的突破

DeepSeek AI发布的DeepSeek-R1模型在数学、代码和推理任务上表现出色,无需SFT直接通过RL训练,解决了重复性和可读性问题,并能够将推理能力传授给小模型。在...

DeepSeek-R1:强化学**AI推理模型的革命性突破**

DeepSeek发布的DeepSeek-R1模型,通过强化学**实现了无需教师数据的AI推理能力,在数学、代码和逻辑任务中表现卓越。其创新性在于低成高效、开放源码,并在AI...
1 2