Grok-3 大模型发布：AI 领域的革命性突破

0 0

Grok-3 大模型：AI 领域的革命性突破

近日，马斯克的人工智能初创公司 xAI 发布了更新版 Grok-3 大模型，该模型被称为“地球上最聪明的人工智能”。Grok-3 的计算能力是前代 Grok-2 的 10 倍以上，其训练使用了约 20 万个 GPU 的大型数据中心。这一突破性进展不仅在算力上实现了质的飞跃，更在多项基准测试中刷新了 SOTA（State of the Art），成为 AI 领域的新标杆。

性能表现：全面领先

在多项基准测试中，Grok-3 在数学（AIME 2024）、科学问答（GPQA）、编码（LCB）等领域均大幅领先于其他模型，如 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。特别是在编程、数学、创意写作、指令遵循、长查询、多轮对话等场景中，Grok-3 每个维度上都排名第一。

推理能力：解锁测试时计算

Grok-3 支持推理能力，并解锁了测试时计算（test-time compute）能力。其推理模型 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 在数学（AIME’24）、科学（GPQA）和编码（LCB Oct-Feb）上表现优异，大幅超越了 o3-mini、DeepSeek-R1 等推理模型。在 AIME 2025 数学竞赛中，Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 分别拿下了 93 和 90 分，刷新了 SOTA。

智能体“深度搜索”：深入互联网的探索

Grok-3 还推出了首个智能体“深度搜索”（Deep Search）模式，能够在互联网上进行更深入的搜索。该模式分析大量信息，并通过快速高效的搜索过程提供详细、合理的答案。通过深度搜索，用户可以进行深入研究、头脑风暴、分析数据、生成图像、编写和调试代码等。例如，询问“下一次星舰发射是什么时候？”，智能体会展示搜索和推理过程，并给出详细答案。

开源与未来展望

马斯克表示，Grok-3 将在几个月后全面开源，这无疑将进一步推动 AI 产业生态的发展。目前，订阅 Premium Plus 的 X 用户将首先用上 Grok-3，其他功能需要订阅 xAI 称之为 SuperGrok 的版本。SuperGrok 的价格为每月 30 美元或每年 300 美元，可解锁更多推理和 DeepSearch 查询，并提供无限的图像生成。

AI 生态的推动力

Grok-3 的发布不仅是一次技术上的突破，更是对整个 AI 产业生态的推动。诸如 FlashMLA 等效率代码的发布，将进一步提高模型推理效率，对蓬勃发展的 AI 硬件/软件生态系统合作伙伴和 AI 应用是个利多。同时，云服务/GPU 租赁供应商或也将受益于电脑价格下降，以及更高的 GPU 利用率带来的资本支出回报率上升。

Grok-3 的发布标志着 AI 领域的一次革命性突破，其强大的性能和智能体能力将为未来的 AI 应用开辟新的可能性。