万相2.1大模型开源引爆全球
近日,阿里云开源的万相2.1大模型在Hugging Face榜单上迅速登顶,成为全球开源社区最受欢迎的模型。仅6天时间,万相2.1便反超DeepSeek—R1,登顶模型热榜和模型空间榜两大榜单。这一成就不仅彰显了万相2.1的技术实力,也体现了其在全球开发者中的广泛认可。
技术亮点与性能表现
万相2.1大模型的开源采用Apache2.0协议,开放了14B和1.3B两个参数规格的推理代码与权重,支持文生视频和图生视频任务。在权威评测集Vbench中,14B版本的万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B版本则不仅超过了更大尺寸的开源模型,甚至接近部分闭源模型的表现,同时能在消费级显卡运行,仅需8.2GB显存即可生成480P视频,适用于二次模型开发和学术研究。
开源社区的热烈反响
万相2.1在Hugging Face及魔搭社区的总下载量已超百万,在Github的Star数据超6K。这一数据充分证明了万相2.1在开源社区中的受欢迎程度。紧随其后,Microsoft的The Ultra-Scale playbook和DeepSeek—R1分别位列第二和第三。
技术创新的背后
万相2.1大模型的卓越表现,离不开一系列技术创新的支持。其基于主流的DiT和线性噪声轨迹Flow Matching范式,通过自研高效的因果3D VAE、可扩展的预训练策略、大规模数据链路构建以及自动化评估指标,实现了生成能力的重大进步。这些创新共同提升了模型的最终性能表现,使其在复杂运动和物理规律遵循上的表现大幅提升。
未来应用场景的广阔前景
随着以万相为代表的AI视频生成工具的持续更迭,未来其向多钟应用场景的渗透有望加速。山西证券指出,应用层可关注创意、设计、教育等多模态,尤其是视频生成相关的领域。另一方面,视频生成模型对算力需求相较文本显著提升,可重点关注AI算力相关领域。
结语
阿里万相2.1大模型的开源,不仅为全球开发者提供了强大的工具,也推动了AI技术在视频生成领域的进一步发展。其卓越的性能和广泛的应用前景,预示着AI技术在未来将带来更多的创新和变革。