标签:基准测试
Grok-3与DeepSearch:AI新纪元的开启者
马斯克带领xAI团队发布了被誉为“全世界最聪明AI”的Grok-3大模型及其首个AI智能体DeepSearch。Grok-3在多项基准测试中表现优异,超越多个竞争对手。环球时报对...
Anthropic的崛起:AI领域的新星与Google的博弈
过去一个月内,Anthropic的新语言模型在基准测试中表现优异,接近甚至超越GPT-4。然而,其与Google的深度合作引发了反垄断关注。本文将探讨Anthropic的技术创...
Qwen 2.5-Max:阿里巴巴开源模型的新里程碑,超越Llama-3.1-405B
阿里巴巴最新发布的Qwen 2.5-Max模型在11项基准测试中超越了DeepSeek-V3、Llama-3.1-405B和Qwen2.5-72B等顶尖模型,标志着中国在开源人工智能领域的又一重大...
MLGym:开启AI研究代理的新时代
Meta开源的MLGym是首个专门用于机器学习任务的Gym环境,通过13个开放式任务训练AI掌握从生成想法到实验分析的完整研究能力。任务涵盖计算机视觉、自然语言处...
OpenAI GPT-4.5 Orion:AI模型的新里程碑与未来挑战
OpenAI于2025年2月发布的最新AI模型GPT-4.5 Orion,以其强大的世界知识、情感智能和自然对话能力成为焦点。尽管在多项基准测试中表现出色,但其高成本和推理...
AI军备竞赛:Grok-3与DeepSeek-V3的算力较量
在AI军备竞赛中,马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍,并在多项基准测试中刷新SOTA,超越其他主流AI模型。资本对此反应迅速,相关股...
AI军备竞赛升级:Grok-3与DeepSeek-V3的算力与性能对决
在AI军备竞赛中,马斯克的Grok-3模型以惊人的算力消耗和多项基准测试中的卓越表现,超越了DeepSeek-V3等主流AI模型。然而,高昂的成本和激烈的市场竞争也让资...
AI军备竞赛白热化:Grok-3模型刷新SOTA,资本市场反应迅速
在AI军备竞赛中,马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍,并在多项基准测试中刷新SOTA,超越其他主流AI模型。资本对此反应迅速,相关股...
Grok-3与DeepSeek-V3:AI军备竞赛的新篇章
马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍,并在多项基准测试中刷新SOTA,超越其他主流AI模型。这场AI军备竞赛不仅推动了技术进步,也引发...
马斯克Grok-3模型掀起AI军备竞赛,Gemini 2.0 Flash Thinking能否迎战?
马斯克旗下xAI公司发布的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍,并在多项基准测试中刷新SOTA,超越其他主流AI模型。本文探讨了Grok-3的发布对AI...
1
2