Story-Adapter 是一个基于扩散模型的AI框架,专为长故事可视化设计。它通过迭代优化和全球参考交叉注意力模块(GRCA),从文本叙述生成连贯的图像序列,无需额外训练即可处理长达100帧的故事。该框架显著提升了多图像间的语义一致性及细粒度交互质量,解决了传统文本到图像模型在长序列生成中的缺陷传播问题。2024年研究数据显示,其在角色相似度(aCCS)和图像质量(aFID)指标上均优于同类方案。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型