所有AI工具AI图像工具AI开发框架AI开源项目

AutoStudio开源项目 – 多代理图像生成框架

AutoStudio是一种无需训练的多代理框架,专为多轮交互式图像生成设计。它能够在生成多样化图像的同时保持主体一致性,通过多个代理协同工作,包括基于大型语言模型(LLMs)的代理...

标签:

AI交流(进群备注:AutoStudio)

AutoStudio是一种无需训练的多代理框架,专为多轮交互式图像生成设计。它能够在生成多样化图像的同时保持主体一致性,通过多个代理协同工作,包括基于大型语言模型(LLMs)的代理和稳定扩散(SD)代理,确保生成高质量图像。

AutoStudio的特点:

  • 1. 图像生成框架:使用三个基于大型语言模型(LLMs)的代理和一个稳定扩散(SD)代理来生成高质量图像。
  • 2. 主体管理:一个主体管理器负责解释互动对话并管理每个主体的上下文。
  • 3. 布局生成:布局生成器生成细粒度的边界框以控制主体位置。
  • 4. 监督优化:一个监督者提供布局优化建议。
  • 5. 图像绘制:一个绘图员负责完成图像生成。
  • 6. Parallel-UNet:引入Parallel-UNet替代原始UNet,使用两个并行的交叉注意力模块来利用主体感知特征。
  • 7. 主体初始化生成:采用主体初始化生成方法更好地保留小主体。
  • 8. 实验结果:在CMIGBench基准测试和人类评估中,AutoStudio在多轮交互中很好地保持了多主体一致性,并在平均Fréchet Inception Distance上提升了13.65%,在平均字符-字符相似度上提升了2.83%。

AutoStudio的功能:

  • 1. 用于生成角色和情节连续的漫画。
  • 2. 用于多轮交互式图像生成,保持主体一致性。
  • 3. 用于生成多样化图像,同时控制主体位置和布局。
  • 4. 用于优化图像生成过程中的布局和主体管理。

相关导航

暂无评论

暂无评论...