所有AI工具AI写作工具AI图像工具AI开源项目

SEED-Story开源项目 – 多模态长篇故事生成

SEED-Story是由腾讯ARC实验室推出的一个多模态长篇故事生成项目。它基于大型语言模型(MLLM),能够从用户提供的图像和文本开始,生成包含丰富、连贯的叙事文本以及风格一致的图像...

标签:

AI交流(进群备注:SEED-Story)

SEED-Story是由腾讯ARC实验室推出的一个多模态长篇故事生成项目。它基于大型语言模型(MLLM),能够从用户提供的图像和文本开始,生成包含丰富、连贯的叙事文本以及风格一致的图像的多模态长篇故事。项目包括多模态故事生成模型、StoryStream数据集以及三阶段的技术方法(视觉分词、指令调优和去分词器适应)。用户可以通过提供起始图像和文本,生成多达25个多模态序列的故事,且生成的图像与叙事文本在风格和角色上保持高度一致。

SEED-Story的特点:

  • 1. 基于大型语言模型(MLLM)生成多模态长篇故事
  • 2. 生成的图像与叙事文本在风格和角色上保持高度一致
  • 3. 支持多达25个多模态序列的故事生成
  • 4. 包含StoryStream数据集,用于训练和评估
  • 5. 采用三阶段技术方法:视觉分词、指令调优和去分词器适应

SEED-Story的功能:

  • 1. 通过提供起始图像和文本生成多模态故事
  • 2. 使用StoryStream数据集进行训练和评估
  • 3. 通过指令调优和去分词器适应优化模型
  • 4. 生成的故事可用于动画制作和AI语音叙述

相关导航

暂无评论

暂无评论...