AI基准测试 | AI-magic

Qwen2.5-72B：阿里巴巴开源大模型的巅峰之作

阿里巴巴最新发布的Qwen2.5-72B开源大模型在多项基准测试中表现卓越，超越了DeepSeek-V3和Llama-3.1-405B等顶尖模型。本文将深入探讨Qwen2.5-72B的技术优势、...

AI快讯

2个月前

阿里巴巴最新发布的Qwen2.5-Max大模型在11项基准测试中全面超越DeepSeek-V3、Llama-3.1-405B等对比模型，展现了其在开源大模型领域的领先地位。本文将深入解...

AI快讯

2个月前

Meta发布的Llama 3.1开源大模型在多项AI基准测试中表现优异，尤其在体育数据分析领域，Sevilla FC通过其构建的Scout Advisor工具，显著提升了球员招募效率。...

AI快讯

2个月前

马斯克的xAI发布Grok 3大模型，宣称其为“地球上最聪明的AI”，但在基准测试中与OpenAI的o3-mini-high引发争议。文章探讨了算力堆积与技术优化的差异，以及AI评...

AI快讯

3个月前