SEED-Story是由腾讯ARC实验室推出的一个多模态长篇故事生成项目。它基于大型语言模型(MLLM),能够从用户提供的图像和文本开始,生成包含丰富、连贯的叙事文本以及风格一致的图像的多模态长篇故事。项目包括多模态故事生成模型、StoryStream数据集以及三阶段的技术方法(视觉分词、指令调优和去分词器适应)。用户可以通过提供起始图像和文本,生成多达25个多模态序列的故事,且生成的图像与叙事文本在风格和角色上保持高度一致。