Qwen 2.5-Max:阿里巴巴开源模型的新里程碑
近日,阿里巴巴发布了其Qwen 2.5人工智能模型的新版本——Qwen 2.5-Max,并宣布其在所有11项基准测试中超越了DeepSeek-V3、Llama-3.1-405B和Qwen2.5-72B等对比模型。这一成就不仅展示了阿里巴巴在人工智能领域的深厚技术积累,也标志着中国在开源AI领域的又一重大突破。
技术优势与基准测试表现
Qwen 2.5-Max使用了超过20万亿token的预训练数据,并经过精心设计的后训练方案进行训练。在通义灵码智能问答、AI程序员窗口的输入框中,用户可以通过下拉菜单选择该模型。阿里巴巴在一系列广受关注的基准测试中,将Qwen 2.5-Max与业界领先的模型进行了对比评估,包括Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等。结果显示,Qwen 2.5-Max在这些测试中均表现出色,尤其是在基座模型的对比中,其性能显著优于DeepSeek V3、Llama-3.1-405B和Qwen2.5-72B。
开源模型生态的全球竞争
Qwen 2.5-Max的发布不仅是对阿里巴巴自身技术实力的展示,也是对全球开源模型生态的一次重要贡献。在全球最大AI开源社区Hugging Face上,基于Qwen的开源大模型的衍生模型数量已突破10万,稳居全球最大开源模型榜首。这一成就不仅巩固了阿里巴巴在开源模型领域的领先地位,也为全球开发者提供了更多选择和可能性。
中国AI开源生态的崛起
杭州,这座曾经的互联网之城,正在逐渐转变为AI开源之城。阿里巴巴与DeepSeek的开源模型,已经改变了大模型的全球竞争格局,也将改变大模型应用市场的发展方向。更高性价比的开源模型,正在推动基于前沿闭源大模型的AI服务大幅降价,惠及更多用户。中国在开源模型创新上的成功将随着应用于服务扩散至全球。
未来展望
阿里巴巴豪言要在未来三年投入至少520亿美元在AI及其基础设施上,希望能为整个大模型生态开源出通往AGI之路。从董事长蔡崇信到CEO吴泳铭,都认为AGI可能并不是某个全面超越人类能力的大模型,而是AI能灵活地部署到对人类有价值的各场景中,让天下没有难用的AI。
Qwen 2.5-Max的发布,不仅是阿里巴巴技术创新的又一里程碑,也是中国在全球AI开源生态中占据主导地位的重要标志。未来,随着更多开源模型的推出和应用,中国有望成为全球AI开源生态的核心,推动AI技术的普惠化和商业化。