AutoStudio开源项目 – 多代理图像生成框架

AutoStudio是一种无需训练的多代理框架，专为多轮交互式图像生成设计。它能够在生成多样化图像的同时保持主体一致性，通过多个代理协同工作，包括基于大型语言模型（LLMs）的代理和稳定扩散（SD）代理，确保生成高质量图像。

AutoStudio的特点:

1. 图像生成框架：使用三个基于大型语言模型（LLMs）的代理和一个稳定扩散（SD）代理来生成高质量图像。
2. 主体管理：一个主体管理器负责解释互动对话并管理每个主体的上下文。
3. 布局生成：布局生成器生成细粒度的边界框以控制主体位置。
4. 监督优化：一个监督者提供布局优化建议。
5. 图像绘制：一个绘图员负责完成图像生成。
6. Parallel-UNet：引入Parallel-UNet替代原始UNet，使用两个并行的交叉注意力模块来利用主体感知特征。
7. 主体初始化生成：采用主体初始化生成方法更好地保留小主体。
8. 实验结果：在CMIGBench基准测试和人类评估中，AutoStudio在多轮交互中很好地保持了多主体一致性，并在平均Fréchet Inception Distance上提升了13.65%，在平均字符-字符相似度上提升了2.83%。

AutoStudio的功能:

1. 用于生成角色和情节连续的漫画。
2. 用于多轮交互式图像生成，保持主体一致性。
3. 用于生成多样化图像，同时控制主体位置和布局。
4. 用于优化图像生成过程中的布局和主体管理。

相关导航

PLAN-AND-ACT论文 – 提升LLM代理长期任务规划能力

PLAN-AND-ACT 是一个旨在提升大型语言模型（LLM）代理在长期任务中规划能力的框架。它通过分离高层次规划和低层次执行，结合动态重新规划和合成数据生成方法，显著增强了代理在复杂任务中的性能和鲁棒性。该框架包括 PLANNER 和 EXECUTOR 两个核心组件，分别负责生成结构化计划并将其转化为环境特定的动作。

Inbox Zero开源项目 – 开源AI邮件助手

Inbox Zero 是一款开源邮件应用，旨在帮助用户快速实现收件箱清零。它包含一个 AI 邮件助手和一个邮件客户端。AI 邮件助手利用自然语言处理功能自动回复邮件、分类发件人、取消订阅不需要的邮件列表等。邮件客户端则提供批量操作、邮件分析、屏蔽陌生邮件等功能。项目使用 Next.js、Tailwind CSS 和 Prisma 等技术构建，支持多种 LLM 模型，如 Anthropic、OpenAI 和 Ollama。

Autopilot开源项目 – 一款智能代码自动处理工具

Autopilot 是一款利用 GPT 技术的 AI 工具，能够读取代码库，创建上下文，并解决用户请求的任务。它通过自动化代码分析来提升开发人员的生产力，并支持多种编程语言。

text-generation-webui开源项目 – 本地版LLaMA模型的Web交互界面

stable-diffusion-webui的LLaMA版，让你可以通过一个Web界面和本机的LLaMA模型交互，提供本地版的ChatGPT体验。