数学推理 | 第 2 页

强化学习之力：QwQ-32B如何以320亿参数挑战巨型模型

阿里开源发布的全新推理模型QwQ-32B，凭借320亿参数，通过大规模强化学习训练，在数学推理和编程任务上表现卓越，甚至能与6710亿参数的DeepSeek-R1媲美。本文...

AI快讯

2个月前

本文深入探讨了Grok 3与Gemini 2.0 Pro在数学、科学和代码测试集上的表现，揭示了AI模型在预训练scaling law上的瓶颈。通过对比分析，我们展示了Grok 3的强大...

AI快讯

2个月前

中国人工智能公司深度求索（DeepSeek）发布的DeepSeek-V3大模型在较低成本和较小算力规模下实现了与美国顶尖AI模型相当的效果，引发全球科技行业高度关注。该...

AI快讯

2个月前

Anthropic最新发布的Claude 3.7 Sonnet，凭借其“思考模式”和统一推理架构，在AI推理领域树立了新标杆。本文深入探讨其技术优势、企业应用场景以及与OpenAI和D...

AI快讯

2个月前

随着生成式AI技术的快速发展，Deepseek和OpenAI的AI助手成为行业焦点。Deepseek凭借其成本效益、开源策略和卓越的数学推理能力，正在挑战OpenAI的领先地位。...

AI快讯

2个月前

OpenAI推出全新生成式AI模型ChatGPT-4o，其在复杂推理尤其是数学领域表现卓越，可媲美人类专家。尽管在安全性和与人类价值观对齐方面有所改进，但尚未解决幻...

AI快讯

2个月前