基准测试 | AI-magic

Grok-3与DeepSearch：AI新纪元的开启者

马斯克带领xAI团队发布了被誉为“全世界最聪明AI”的Grok-3大模型及其首个AI智能体DeepSearch。Grok-3在多项基准测试中表现优异，超越多个竞争对手。环球时报对...

AI快讯

2个月前

过去一个月内，Anthropic的新语言模型在基准测试中表现优异，接近甚至超越GPT-4。然而，其与Google的深度合作引发了反垄断关注。本文将探讨Anthropic的技术创...

AI快讯

2个月前

阿里巴巴最新发布的Qwen 2.5-Max模型在11项基准测试中超越了DeepSeek-V3、Llama-3.1-405B和Qwen2.5-72B等顶尖模型，标志着中国在开源人工智能领域的又一重大...

AI快讯

2个月前

Meta开源的MLGym是首个专门用于机器学习任务的Gym环境，通过13个开放式任务训练AI掌握从生成想法到实验分析的完整研究能力。任务涵盖计算机视觉、自然语言处...

AI快讯

2个月前

OpenAI于2025年2月发布的最新AI模型GPT-4.5 Orion，以其强大的世界知识、情感智能和自然对话能力成为焦点。尽管在多项基准测试中表现出色，但其高成本和推理...

AI快讯

2个月前

在AI军备竞赛中，马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍，并在多项基准测试中刷新SOTA，超越其他主流AI模型。资本对此反应迅速，相关股...

AI快讯

3个月前

在AI军备竞赛中，马斯克的Grok-3模型以惊人的算力消耗和多项基准测试中的卓越表现，超越了DeepSeek-V3等主流AI模型。然而，高昂的成本和激烈的市场竞争也让资...

AI快讯

3个月前

在AI军备竞赛中，马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍，并在多项基准测试中刷新SOTA，超越其他主流AI模型。资本对此反应迅速，相关股...

AI快讯

3个月前

马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍，并在多项基准测试中刷新SOTA，超越其他主流AI模型。这场AI军备竞赛不仅推动了技术进步，也引发...

AI快讯

3个月前

马斯克旗下xAI公司发布的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍，并在多项基准测试中刷新SOTA，超越其他主流AI模型。本文探讨了Grok-3的发布对AI...

AI快讯

3个月前