标签:Phantom框架
跨模态对齐:文本-图像-视频三元数据驱动AI视频生成新突破
字节跳动最新的AI视频论文提出了一种名为Phantom的统一视频生成框架,通过跨模态对齐实现主题一致的视频生成。该框架重新设计了联合文本-图像注入模型,利用...
字节跳动Phantom框架:跨模态对齐驱动的主题一致视频生成
字节跳动最新发布的Phantom框架通过跨模态对齐技术,重新设计了文本-图像注入模型,实现了主题一致的视频生成。该框架在文本到视频和图像到视频任务中表现出...