所有AI工具AI开发框架AI开源项目AI视频工具

Goku开源项目 – 基于流的高质量视频生成模型

Goku是由字节跳动与香港大学联合开发的一款基于Rectified Flow Transformer架构的视频生成模型。它通过精细的数据处理、模型设计和流式生成技术,实现了高质量的图像和视频生成。G...

标签:

AI交流(进群备注:Goku)

Goku是由字节跳动与香港大学联合开发的一款基于Rectified Flow Transformer架构的视频生成模型。它通过精细的数据处理、模型设计和流式生成技术,实现了高质量的图像和视频生成。Goku支持多种生成任务,包括文本到视频、图像到视频和文本到图像生成,尤其在虚拟数字人和广告场景中表现突出。在权威测试VBench中,Goku的文本到视频生成得分达84.85,创下新纪录(SOTA)。

Goku的特点:

  • 1. 基于Rectified Flow Transformer架构
  • 2. 支持文本到视频、图像到视频和文本到图像生成
  • 3. 高质量的图像和视频生成
  • 4. 在虚拟数字人和广告场景中表现突出
  • 5. 在VBench测试中创下新纪录(SOTA)

Goku的功能:

  • 1. 生成虚拟数字人视频
  • 2. 生成广告场景视频
  • 3. 生成动画、自然风光、动物行为等多种场景视频
  • 4. 支持视频长度达20秒以上,画面连贯稳定

相关导航

暂无评论

暂无评论...