AI交流(进群备注:Goku)

Goku是由字节跳动与香港大学联合开发的一款基于Rectified Flow Transformer架构的视频生成模型。它通过精细的数据处理、模型设计和流式生成技术,实现了高质量的图像和视频生成。Goku支持多种生成任务,包括文本到视频、图像到视频和文本到图像生成,尤其在虚拟数字人和广告场景中表现突出。在权威测试VBench中,Goku的文本到视频生成得分达84.85,创下新纪录(SOTA)。
Goku的特点:
- 1. 基于Rectified Flow Transformer架构
- 2. 支持文本到视频、图像到视频和文本到图像生成
- 3. 高质量的图像和视频生成
- 4. 在虚拟数字人和广告场景中表现突出
- 5. 在VBench测试中创下新纪录(SOTA)
Goku的功能:
- 1. 生成虚拟数字人视频
- 2. 生成广告场景视频
- 3. 生成动画、自然风光、动物行为等多种场景视频
- 4. 支持视频长度达20秒以上,画面连贯稳定
相关导航
暂无评论...