DeepSeek新一代AI模型R2提前发布
近日,DeepSeek宣布计划提前发布其新一代AI模型R2。据路透社报道,R2原定于5月初发布,但DeepSeek希望尽快推出。新模型在编程能力和多语言推理方面有显著提升,备受市场关注。
R2模型的亮点
-
编程能力提升:R2在编码和SWE-Bench方面已经与OpenAI匹敌,甚至在没有使用强化学习(RL)的情况下表现优异。
-
多语言推理优化:新模型在多语言推理方面进行了优化,能够更好地处理复杂语言任务。
-
成本效益显著:DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本,比OpenAI同类模型便宜20到40倍。
行业反响
印度技术服务提供商Zensar的首席运营官Vijayasimha Alilughatta表示:“DeepSeek的R2模型发布可能会成为AI行业的一个关键时刻,打破目前由几家主导企业垄断的格局。”
DeepSeek的成功因素
DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。
AI芯片需求激增
DeepSeek的崛起引发了对英伟达AI芯片需求的激增。据路透社消息,中国企业腾讯、阿里巴巴及字节跳动都大幅增加了对H20芯片的订单。这一趋势表明,AI芯片仍然是科技公司在人工智能竞赛中的“制胜法宝”。
英伟达的财报焦点
英伟达即将公布截至今年1月底的2025财年第四季度业绩报告,其AI芯片需求成为市场关注的焦点。根据LSEG的数据,英伟达第四财季收入预计将激增72%,至380.5亿美元。
阿里巴巴的开源模型
与此同时,阿里巴巴也全面开源了旗下视频生成模型万相2.1模型。该模型在视频生成、图像生成两大能力均获得提升,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能。
开源模型的意义
随着万相2.1模型的开源,更多的开发者将能够低成本获取并使用该模型底层代码,进而用以开展与自身业务相关的各类视频生成应用。
结论
DeepSeek新一代AI模型R2的提前发布,以及其成功引发的AI芯片需求激增,标志着AI行业正迎来新的变革。DeepSeek的崛起不仅打破了现有市场格局,也为全球AI技术的发展注入了新的活力。