推理模型 | 第 5 页

DeepSeek-VL2：中国AI崛起与美国人才流动的反思

中国人工智能初创企业DeepSeek的崛起引发了美国对AI人才流动的反思。DeepSeek的关键工程师潘梓正曾在美国英伟达实习，但选择回国加入DeepSeek，并在多个重要...

AI快讯

4个月前

近日，月之暗面推出Kimi数学版，这款智能助手在数学学习与推理方面展现了强大的能力。结合最新的AI技术，Kimi数学版不仅能够提供精准的数学解答，还能模拟人...

AI快讯

4个月前

本文探讨了AI Agent的最新发展，重点介绍了DeepSeek-R1和NVIDIA NIM的技术突破。DeepSeek-R1凭借其强大的推理能力和多步问题解决能力，正在推动AI Agent的应...

AI快讯

4个月前

Anthropic最新发布的Claude 3.7 Sonnet模型，结合大语言模型与推理模型，显著提升了编码能力与推理性能。该模型在SWE-bench Verified基准测试中表现优异，同...

AI快讯

4个月前

字节对编码（BPE）作为一种高效的子词分割方法，在大语言模型的训练和推理中扮演着关键角色。本文将探讨BPE在生成模型中的应用，以及如何通过优化计算资源和...

AI快讯

4个月前

DeepSeek R1作为一款开源AI模型，以低廉的训练成本和高性能在AI竞技场中脱颖而出，与ChatGPT-4o并列第三。本文将探讨其市场影响及在各自领域的应用。

AI快讯

4个月前

国内技术团队通过OpenReasonerZero项目，成功将DeepSeek-R1-Zero的训练步骤减少至原来的1/30，显著提升了训练效率。这一突破不仅简化了强化学习的训练流程，...

AI快讯

4个月前

Open Reasoner Zero (ORZ)模型在推理训练领域取得重大突破，仅需1/30的训练步骤即可媲美DeepSeek-R1-Zero的性能。阶跃星辰与清华大学联合发布，沈向洋等AI领...

AI快讯

4个月前

英伟达财报电话会中，分析师与公司高管深入探讨了AI技术的发展、Nvidia产品的市场表现及未来规划。本文详细解析了训练与推理的界限模糊、GB200架构的部署、毛...

AI快讯

4个月前

DeepSeek-R1大模型以其卓越的推理能力和低成本开源特性，迅速成为车企智能化升级的首选。多家车企通过融合DeepSeek技术，实现了智能座舱的交互与场景理解功能...

AI快讯

4个月前