Grok-3 大模型发布:AI 领域的革命性突破

AI快讯2周前发布 admin
0 0

Grok-3 大模型:AI 领域的革命性突破

近日,马斯克的人工智能初创公司 xAI 发布了更新版 Grok-3 大模型,该模型被称为“地球上最聪明的人工智能”。Grok-3 的计算能力是前代 Grok-2 的 10 倍以上,其训练使用了约 20 万个 GPU 的大型数据中心。这一突破性进展不仅在算力上实现了质的飞跃,更在多项基准测试中刷新了 SOTA(State of the Art),成为 AI 领域的新标杆。

性能表现:全面领先

在多项基准测试中,Grok-3 在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)等领域均大幅领先于其他模型,如 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。特别是在编程、数学、创意写作、指令遵循、长查询、多轮对话等场景中,Grok-3 每个维度上都排名第一。

推理能力:解锁测试时计算

Grok-3 支持推理能力,并解锁了测试时计算(test-time compute)能力。其推理模型 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 在数学(AIME’24)、科学(GPQA)和编码(LCB Oct-Feb)上表现优异,大幅超越了 o3-mini、DeepSeek-R1 等推理模型。在 AIME 2025 数学竞赛中,Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 分别拿下了 93 和 90 分,刷新了 SOTA。

智能体“深度搜索”:深入互联网的探索

Grok-3 还推出了首个智能体“深度搜索”(Deep Search)模式,能够在互联网上进行更深入的搜索。该模式分析大量信息,并通过快速高效的搜索过程提供详细、合理的答案。通过深度搜索,用户可以进行深入研究、头脑风暴、分析数据、生成图像、编写和调试代码等。例如,询问“下一次星舰发射是什么时候?”,智能体会展示搜索和推理过程,并给出详细答案。

开源与未来展望

马斯克表示,Grok-3 将在几个月后全面开源,这无疑将进一步推动 AI 产业生态的发展。目前,订阅 Premium Plus 的 X 用户将首先用上 Grok-3,其他功能需要订阅 xAI 称之为 SuperGrok 的版本。SuperGrok 的价格为每月 30 美元或每年 300 美元,可解锁更多推理和 DeepSearch 查询,并提供无限的图像生成。

AI 生态的推动力

Grok-3 的发布不仅是一次技术上的突破,更是对整个 AI 产业生态的推动。诸如 FlashMLA 等效率代码的发布,将进一步提高模型推理效率,对蓬勃发展的 AI 硬件/软件生态系统合作伙伴和 AI 应用是个利多。同时,云服务/GPU 租赁供应商或也将受益于电脑价格下降,以及更高的 GPU 利用率带来的资本支出回报率上升。

Grok-3 的发布标志着 AI 领域的一次革命性突破,其强大的性能和智能体能力将为未来的 AI 应用开辟新的可能性。

© 版权声明

相关文章

暂无评论

暂无评论...