DeepSeek新一代AI模型R2提前发布,AI行业迎来新变革

AI快讯4个月前发布 admin
0 0

DeepSeek新一代AI模型R2提前发布,AI行业迎来新变革

DeepSeek新一代AI模型R2提前发布

近日,DeepSeek宣布计划提前发布其新一代AI模型R2。据路透社报道,R2原定于5月初发布,但DeepSeek希望尽快推出。新模型在编程能力多语言推理方面有显著提升,备受市场关注。

R2模型的亮点

  • 编程能力提升:R2在编码和SWE-Bench方面已经与OpenAI匹敌,甚至在没有使用强化学习(RL)的情况下表现优异。

  • 多语言推理优化:新模型在多语言推理方面进行了优化,能够更好地处理复杂语言任务。

  • 成本效益显著:DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本,比OpenAI同类模型便宜20到40倍。

行业反响

印度技术服务提供商Zensar的首席运营官Vijayasimha Alilughatta表示:“DeepSeek的R2模型发布可能会成为AI行业的一个关键时刻,打破目前由几家主导企业垄断的格局。”

DeepSeek的成功因素

DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。

DeepSeek新一代AI模型R2提前发布,AI行业迎来新变革

DeepSeek新一代AI模型R2提前发布,AI行业迎来新变革

AI芯片需求激增

DeepSeek的崛起引发了对英伟达AI芯片需求的激增。据路透社消息,中国企业腾讯、阿里巴巴及字节跳动都大幅增加了对H20芯片的订单。这一趋势表明,AI芯片仍然是科技公司在人工智能竞赛中的“制胜法宝”。

英伟达的财报焦点

英伟达即将公布截至今年1月底的2025财年第四季度业绩报告,其AI芯片需求成为市场关注的焦点。根据LSEG的数据,英伟达第四财季收入预计将激增72%,至380.5亿美元。

DeepSeek新一代AI模型R2提前发布,AI行业迎来新变革

阿里巴巴的开源模型

与此同时,阿里巴巴也全面开源了旗下视频生成模型万相2.1模型。该模型在视频生成、图像生成两大能力均获得提升,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能。

开源模型的意义

随着万相2.1模型的开源,更多的开发者将能够低成本获取并使用该模型底层代码,进而用以开展与自身业务相关的各类视频生成应用。

结论

DeepSeek新一代AI模型R2的提前发布,以及其成功引发的AI芯片需求激增,标志着AI行业正迎来新的变革。DeepSeek的崛起不仅打破了现有市场格局,也为全球AI技术的发展注入了新的活力。

© 版权声明

相关文章

暂无评论

暂无评论...