万相2.1是阿里云开源的视频生成大模型,采用Apache2.0协议开源,支持文生视频和图生视频任务,提供14B和1.3B两个参数规格的推理代码和权重。该模型在评测集VBench中以86.22%的总分领先,支持多种视频生成任务,开源且易于集成。14B版本在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,1.3B版本能在消费级显卡运行,仅需8.2GB显存生成480P视频。