万相2.1是阿里云开源的视频生成大模型,采用Apache2.0协议开源,支持文生视频和图生视频任务,提供14B和1.3B两个参数规格的推理代码和权重。该模型在评测集VBench中以86.22%的总分领先,支持多种视频生成任务,开源且易于集成。14B版本在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,1.3B版本能在消费级显卡运行,仅需8.2GB显存生成480P视频。
Wan2.1是阿里云推出的开源视频大模型,支持消费级显卡进行AI视频生成,具备140亿参数,展现出卓越的性能表现,能够处理复杂的运动和细腻的情感捕捉,适合多种视频生成任务。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型