推理模型 | 第 4 页

强化学习之力：QwQ-32B如何以320亿参数挑战巨型模型

阿里开源发布的全新推理模型QwQ-32B，凭借320亿参数，通过大规模强化学习训练，在数学推理和编程任务上表现卓越，甚至能与6710亿参数的DeepSeek-R1媲美。本文...

AI快讯

3个月前

DeepSeek-R1作为一款拥有6710亿参数的大型推理模型，在数学和编程任务中表现出色。尽管面临来自Alibaba QwQ-32B等竞争对手的挑战，DeepSeek-R1凭借其独特的混...

AI快讯

3个月前

本文深入探讨了人工智能领域的最新进展，从大型语言模型的演变到多模态模型的应用，涵盖了Transformer架构、推理模型、开源AI技术等关键主题，揭示了AI技术的...

AI快讯

3个月前

本文探讨了深度学习的演变历程，从Transformer架构的引入到多模态AI的兴起，详细分析了大语言模型的工作原理、技术基础及其在业务环境中的应用。文章还讨论了...

AI快讯

3个月前

本文深入探讨OpenAI o1模型的核心特性及其在推理领域的表现，同时分析其与GPT-4.5、Deep Research等产品的对比，展望AI推理能力的未来发展方向。

AI快讯

3个月前

本文探讨了大语言模型（LLMs）的现状与未来，结合杨立昆的质疑与DeepSeek的突破，分析了LLMs在实现通用人工智能（AGI）中的局限性及其可能的突破方向。文章还...

AI快讯

3个月前

中国人工智能公司深度求索（DeepSeek）推出的DeepSeek R1推理模型，凭借其卓越的数学、代码和自然语言推理能力，迅速在AI领域崭露头角。该模型不仅与OpenAI的...

AI快讯

3个月前

本文深入探讨了DeepSeek与OpenAI在技术路径和商业化模式上的差异，重点分析了DeepSeek的推理模型训练方法，包括高质量数据冷启动、面向推理的强化学习以及数...

AI快讯

4个月前

OpenAI于2025年2月发布的最新AI模型GPT-4.5 Orion，以其强大的世界知识、情感智能和自然对话能力成为焦点。尽管在多项基准测试中表现出色，但其高成本和推理...

AI快讯

4个月前

OpenAI推出全新推理模型o3-mini，首次向免费用户开放，具备强大的科学、数学和编码能力，同时维持低成本和低延迟特性。CEO Sam Altman罕见承认开源策略失误，...

AI快讯

4个月前