Story-Adapter 是一个基于扩散模型的AI框架,专为长故事可视化设计。它通过迭代优化和全球参考交叉注意力模块(GRCA),从文本叙述生成连贯的图像序列,无需额外训练即可处理长达100帧的故事。该框架显著提升了多图像间的语义一致性及细粒度交互质量,解决了传统文本到图像模型在长序列生成中的缺陷传播问题。2024年研究数据显示,其在角色相似度(aCCS)和图像质量(aFID)指标上均优于同类方案。
Story-Adapter 是一个无需训练且计算高效的框架,专门用于长故事可视化。它通过迭代范式生成基于叙事的连贯图像,利用文本提示和之前生成的图像进行优化。其核心是一个全局参考交叉注意力模块,确保整个故事的语义一致性,同时最小化计算成本。该项目特别适用于长达100帧的故事场景,支持多种风格选择,如漫画、电影和现实主义风格。