标签:主体一致性

跨模态对齐:文本-图像-视频三元数据驱动AI视频生成新突破

字节跳动最新的AI视频论文提出了一种名为Phantom的统一视频生成框架,通过跨模态对齐实现主题一致的视频生成。该框架重新设计了联合文本-图像注入模型,利用...