所有AI工具AI开发框架AI开源项目AI视频工具

Step-Video-T2V开源项目 – 高质量文本到视频生成模型

Step-Video-T2V是阶跃星辰团队推出的开源文本到视频预训练模型,拥有300亿参数,能够生成长达204帧的高质量视频。该模型基于深度压缩的变分自编码器(Video-VAE),显著提高了训练和...

标签:

AI交流(进群备注:Step-Video-T2V)

Step-Video-T2V是阶跃星辰团队推出的开源文本到视频预训练模型,拥有300亿参数,能够生成长达204帧的高质量视频。该模型基于深度压缩的变分自编码器(Video-VAE),显著提高了训练和推理效率。配备双语文本编码器,支持中英文提示输入,并通过直接偏好优化(DPO)方法进一步提升视频质量。模型采用扩散的Transformer(DiT)架构和3D全注意力机制,在生成具有强烈运动动态和高美学质量的视频方面表现出色。

Step-Video-T2V的特点:

  • 1. 300亿参数,生成长达204帧的高质量视频
  • 2. 支持中英文双语文本输入
  • 3. 基于深度压缩的变分自编码器(Video-VAE),提高训练和推理效率
  • 4. 采用扩散的Transformer(DiT)架构和3D全注意力机制
  • 5. 通过直接偏好优化(DPO)方法提升视频质量

Step-Video-T2V的功能:

  • 1. 生成高质量的视频内容,适用于影视制作、广告创意等领域
  • 2. 支持多GPU并行部署,优化资源利用
  • 3. 提供单GPU推理和量化支持,降低VRAM需求
  • 4. 可用于生成动态视频,如运动场景、动画等
  • 5. 通过在线引擎跃问视频进行视频生成和探索

相关导航

暂无评论

暂无评论...