Latte是一种新的潜扩散Transformer模型,用于视频生成,能够从输入视频中提取时空token,并通过Transformer块建模潜空间中的视频分布。该模型在多个标准视频生成数据集上取得了最先进的性能,支持文本到视频生成任务,适用于多种复杂的时空视频生成需求。
包含10万个压缩驾驶视频的数据集,用于机器学习研究,可用于GPT视频预测模型的实验,还包含编码器/解码器和视频预测模型示例
Viddyoze是一个功能强大的AI视频生成和编辑工具,可以在几秒钟内创建令人惊叹的视频内容,用户只需与AI对话即可生成故事板,并在AI驱动的视频编辑器中进行编辑和定制。
Rerender A Video 是视频生成视频的AI工具,能够生成效果好且稳定的视频,适合各种视频处理需求。
Kling Video AI 是一款先进的AI视频生成器,用户只需输入文本描述或上传图片,即可瞬间生成强大的AI视频,帮助用户轻松创建出色的视频内容。
GIMM-VFI是一种新的视频插值方法,它使用运动建模来预测帧之间的运动。该方法通过有效建模真实世界视频中的时空动态,能够生成更高质量的运动视频,并且可以与现有的基于流的VFI工作集成。
Diarupt允许您在产品中构建基于视频的实时AI交互,使用人性化的头像和真实的声音,能够进行长时间的对话,通过易于使用的API和SDK进行暴露。
ComfyUI-HunyuanVideoWrapper 是一个用于在 ComfyUI 中集成腾讯混元视频生成模型的插件,支持文生视频(T2V)、图生视频和视频生视频(V2V)操作。它提供了修正版和量化版模型,确保更好的效果和性能,并兼容ComfyUI节点,易于集成和使用。此外,它还支持flash_attn和sageattn两种注意力机制,内存占用取决于分辨率和帧数,即使在低分辨率下也能生成高质量视频。
基于 DeepSeek AI 的数学动画生成器,它使用 Manim 库来自动化地将复杂的数学概念转换为动画,并且支持通过模型优化和训练直接一次性生成高质量的动画。