万相2.1开源项目 – 阿里云开源视频生成大模型

万相2.1是阿里云开源的视频生成大模型，采用Apache2.0协议开源，支持文生视频和图生视频任务，提供14B和1.3B两个参数规格的推理代码和权重。该模型在评测集VBench中以86.22%的总分领先，支持多种视频生成任务，开源且易于集成。14B版本在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，1.3B版本能在消费级显卡运行，仅需8.2GB显存生成480P视频。

万相2.1的特点:

1. 视频生成能力强大
2. 在评测集VBench中以86.22%的总分领先
3. 支持多种视频生成任务
4. 开源且易于集成
5. 支持文生视频和图生视频任务
6. 14B版本在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出
7. 1.3B版本能在消费级显卡运行，仅需8.2GB显存生成480P视频
8. 自研高效的因果3D VAE架构，改进时空压缩和降低内存使用
9. 基于主流的视频DiT结构，确保长时程时空依赖的有效建模
10. 训练和推理效率优化，支持分布式策略和模型切分
11. 全面支持多种主流框架，如Gradio、xDiT、Diffusers和ComfyUI

万相2.1的功能:

1. 用于生成高质量视频内容
2. 适用于视频编辑和创作
3. 可用于视频数据增强
4. 支持视频风格转换
5. 用于生成复杂人物肢体运动视频，如旋转、跳跃、转身、翻滚等
6. 用于还原复杂真实物理场景，如碰撞、反弹、切割等
7. 用于准确理解中英文长文本指令，还原场景切换和角色互动
8. 用于二次模型开发和学术研究
9. 用于快速原型开发和高效生产部署

相关导航

openSora-STDiT-v3模型 – 开源文本生成视频模型

openSora-STDiT-v3 是 Open-Sora 1.2 项目的一部分，由 Lu Chen 团队开发。它是一个开源的文本生成视频模型，能够生成 16 秒 720p 高清视频，支持多种风格，如人物肖像、科幻大片和动画。该模型在视频压缩网络、扩散模型算法和模型评估系统上进行了创新，显著降低了训练成本并提高了视频质量。此外，它支持图像到视频生成和视频扩展功能，适用于游戏开发、影视制作、广告制作、教育培训和个人创作。

通义万相官网 – 多模态AI视频生成工具

通义万相是阿里巴巴云开发的多模态AI模型，能够从文本或图像生成高质量视频，支持多种艺术风格（如中国风、超现实主义等），生成的视频自带音频。最新版本WanX 2.1在2025年1月发布，进一步提升了视频生成的质量和速度，特别是在处理复杂运动和空间关系方面表现出色。该工具广泛应用于电影电视制作、动画设计、广告创作、教育资源生产和文化遗产保护等领域。

跃问视频官网 – AI视频生成工具，支持文生视频

跃问视频是由阶跃星辰推出的一款AI视频生成工具，目前处于免费内测阶段。用户可以通过输入文字描述或选择预设主题（如城市风光、科幻奇观、自然奥秘等）生成最长10秒的高清视频。该工具旨在简化视频创作流程，无需专业技能，适合教育、营销、娱乐等多种场景。

VideoCrafter开源项目 – 开源视频生成与编辑工具

一个用于制作视频内容的开源视频生成和编辑工具箱，由腾讯AI实验室和香港科技大学主导，旨在实现文字到视频（T2V）和图片到视频（I2V）的转化功能。

Ke Ling AI (可灵 AI)官网 – 快手开发的AI视频生成工具

Ke Ling AI 是快手大模型团队开发的基于自研大模型的视频生成工具，能够生成长达 2 分钟、1080p 分辨率、30 帧每秒的高清视频，支持自由调整宽高比。其核心功能包括文生视频、图生视频和运镜控制，模拟现实世界的复杂运动模式和物理特性，展现强大的概念组合和想象力。

WayToAGI官网 – 通往AGI的开源知识库

WayToAGI 是一个由 AI 专家和爱好者共同建设的开源 AI 知识库，旨在整合各种 AI 资源，提供学习 AI 知识、应用 AI 工具和实战案例的平台。它包括文生图、文生视频、文生语音等教程，并持续追踪 AI 领域的最新进展，适合 AI 初学者和行业专家使用。项目内容涵盖从基础概念到高级应用的广泛领域，通过飞书文档和社区活动为用户提供互动和学习体验。

清影官网 – AI视频生成工具

清影是智谱AI推出的一款基于CogVideoX模型的AI视频生成工具，支持文生视频和图生视频功能。它能够快速生成高质量视频，适用于多种创作场景，如表情包、广告、短视频等。用户可以通过智谱清言平台或大模型开放平台免费试用，同时提供付费选项以加速生成。清影2.0版本新增了自动生成与视频内容相关的人声和音效功能，进一步提升了创作效率和视频完整性。

WHEE官网 – AI视觉创作工具

WHEE 是由美图公司开发的高品质 AI 素材生成工具，提供多种 AI 视觉创作功能，包括文生视频、图生视频、文生图、图生图、画面拓展和局部修改等。这些功能旨在简化图像、视频和设计的生产，推进行业数字化，尤其在美学相关解决方案中表现出色。WHEE 适用于设计师、内容创作者和普通用户，帮助用户快速生成创意内容。

ComfyUI+SVD实现文生视频工作流分享官网 – 高效文生视频工作流

该项目是一个基于ComfyUI平台的工作流，结合了SDXL模型（用于文生图）和SVD模型（用于图生视频），旨在通过文本描述快速生成视频。相较于官方工作流，该项目在速度上有显著提升，但视频质量可能不够稳定。工作流由社区贡献者KJ大佬分享，用户可以通过Quark网盘下载并使用。

可灵AI官网 – 快手开发的视频生成AI工具

可灵AI是由快手大模型团队开发的新一代创意生产力平台，专注于视频生成，同时也支持图像生成。它基于快手自研的大模型，提供文生视频、图生视频、视频续写等功能，帮助用户高效创建艺术视频和图像。可灵AI支持多图参考功能，通过上传1至4张参考图片，结合文本描述生成视频，确保主题在多个场景中的视觉一致性，特别适合短片制作。