阿里巴巴开源通义万相2.1:视频生成领域的里程碑

AI快讯3个月前发布 admin
0 0

阿里巴巴开源通义万相2.1:视频生成领域的里程碑

通义万相2.1:视频生成技术的巅峰之作

2月25日,阿里巴巴宣布全面开源旗下视频生成模型通义万相2.1,这一举措标志着视频生成技术迈入了一个新的里程碑。通义万相2.1不仅在文生视频领域表现卓越,还在多个技术领域展现了其广泛的应用潜力。

阿里巴巴开源通义万相2.1:视频生成领域的里程碑

技术升级与性能突破

通义万相2.1模型在视频生成和图像生成两大能力上均有显著提升。通过自研的高效VAE和DiT架构,该模型增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现了中文文字视频生成功能。在权威评测集VBench中,通义万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。

阿里巴巴开源通义万相2.1:视频生成领域的里程碑

阿里巴巴开源通义万相2.1:视频生成领域的里程碑

开源与全球开发者社区

此次开源基于Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。全球开发者可在Github、HuggingFace和魔搭社区下载体验,这一举措将极大地推动视频生成技术的普及和创新。

多领域合作与应用

通义万相2.1的应用不仅限于视频生成,还涉及视频剪辑、编解码优化、边缘计算、AI芯片供应和视觉云计算等多个技术领域。多家公司与阿里巴巴合作,共同推动这一技术在影视创作、动画设计、广告设计等领域的应用,展示了通义万相2.1在多个技术领域的广泛影响力。

未来展望

随着通义万相2.1的开源和广泛应用,视频生成技术将迎来更多的创新和突破。阿里巴巴的这一举措不仅提升了自身在AI领域的技术地位,也为全球开发者提供了强大的技术支持,预示着视频生成技术未来的无限可能。

通过开源通义万相2.1,阿里巴巴不仅展示了其在视频生成领域的技术实力,也为全球AI技术的发展注入了新的活力。未来,随着更多开发者的参与和技术的不断进步,视频生成技术将在更多领域发挥其重要作用。

© 版权声明

相关文章

暂无评论

暂无评论...