openSora-STDiT-v3 是 Open-Sora 1.2 项目的一部分,由 Lu Chen 团队开发。它是一个开源的文本生成视频模型,能够生成 16 秒 720p 高清视频,支持多种风格,如人物肖像、科幻大片和动画。该模型在视频压缩网络、扩散模型算法和模型评估系统上进行了创新,显著降低了训练成本并提高了视频质量。此外,它支持图像到视频生成和视频扩展功能,适用于游戏开发、影视制作、广告制作、教育培训和个人创作。
万相2.1是阿里云开源的视频生成大模型,采用Apache2.0协议开源,支持文生视频和图生视频任务,提供14B和1.3B两个参数规格的推理代码和权重。该模型在评测集VBench中以86.22%的总分领先,支持多种视频生成任务,开源且易于集成。14B版本在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,1.3B版本能在消费级显卡运行,仅需8.2GB显存生成480P视频。
SkyReels-V1-Hunyuan-I2V是基于腾讯混元文生视频微调的图生视频模型,适用于comfyUI平台。该模型主要针对以人为主体的数据,能够捕捉33种独特面部表情,并拥有超过400种自然动作组合。它在开源社区中属于较为先进的图生视频模型,提供了无需充值会员的视频生成解决方案。
Stability公司本周推出的文本生成视频技术,完全开源,能够生成分辨率为576x1024的视频,每个视频包含14或25帧。该技术支持生成多角度视图,对3D场景有深入理解,并通过LoRA技术控制摄像头,生成高分辨率视频。
一种闪电般快速的文本到视频生成模型,使用渐进式对抗扩散蒸馏技术,生成速度比原始 AnimateDiff 快十倍以上。
一个用于制作视频内容的开源视频生成和编辑工具箱,由腾讯AI实验室和香港科技大学主导,旨在实现文字到视频(T2V)和图片到视频(I2V)的转化功能。
BeautyPlus是一款功能丰富的照片和视频编辑工具,提供多种编辑工具和免费内容,旨在让用户轻松编辑和分享生活中的精彩瞬间。用户可以通过访问网站,探索各种可用功能,从而实现创意。
VideoCrafter是一款强大的工具,专门用于根据文本描述自动生成视频,并提供多种视频编辑功能。它集成了深度学习模型,以提升生成效果,具有用户友好的界面设计,并支持多种视频格式,满足用户的不同需求。
Picsart是一个全面的照片和视频编辑工具,旨在帮助创作者实现艺术愿景。它提供强大的编辑工具、AI驱动的功能和丰富的内容库,适合业余爱好者和专业人士使用。无论是修饰照片、设计图形还是制作迷人视频,Picsart都为创意表达提供了多样化的平台。
Mini Motion不仅仅是一个工具,它是短视频爱好者的创意伙伴。该AI工具包旨在提升您的内容创作水平,结合了创新与简约的设计理念。
stable-video-diffusion.cc 是一个免费工具,利用 Hugging Face 的能力,帮助用户轻松将图像转换为视频,并提供教学视频和相关示例。