DreamSampler结合了扩散采样和评分蒸馏技术,旨在实现图像处理中的图像生成与操控。该项目可以通过生成模型实现图像生成,并运用基于评分的技术对现有图像进行操控,提供了强大的图像编辑和生成能力。
DragGAN-Windows-GUI 是一个专为 Windows 系统优化的图形用户界面工具,旨在简化 DragGAN 模型的使用。用户无需配置复杂的环境,解压即可直接使用。该工具内置了 17 个预训练模型,支持通过拖动等方式对图像中的对象进行姿势、形状、表情和布局的调整。此外,它还提供了实时预览功能,方便用户调整参数并保存编辑后的图像。
InvokeAI是一个现代化的用户界面工具,允许用户在本地机器上轻松生成和处理Stable Diffusion图像,并提供丰富的命令行接口以实现脚本和自动化生成。
Chinese LLaVA是一个支持中英文双语的开源多模态模型,能够进行视觉与文本的结合对话,具备高效的理解能力和灵活的应用场景,适合商用开发。
DALL·E Cli 是一个命令行应用程序,旨在通过 OpenAI 提供的 DALL-E 2 API 让用户生成、编辑和过滤图像。用户可以方便地生成独特的艺术作品,调整图像的亮度、对比度和清晰度,并应用各种滤镜和效果。该工具支持将 OpenAI 令牌存储在管理的配置文件中,适用于开源和商业项目。
AnyText AI 是一款开创性的工具,可以将可编辑的文本无缝集成到图像中,支持多种字体、样式和语言。用户只需上传图像并输入所需文本,AI驱动的工具将生成逼真且符合上下文的文本,与图像完美融合。用户还可以编辑生成的文本,包括字体样式和位置。
imaginAIry 是一个强大的图像编辑工具,能够根据用户的文本指令实时生成和编辑图像,支持多种图像格式,并提供友好的用户界面。它集成了多种AI模型,用户可以便捷地进行图像属性调整和效果预览。
阿里巴巴云推出的专为聊天应用设计的强大的视觉语言模型,结合了图像和文本输入,能够生成准确的文本和边界框输出,增强了图像描述、问答、定位和文本-图像理解等任务的能力。
PhotoEditor.AI是一个在线工具,可以快速轻松地使用强大的AI技术增强图像,去除不需要的物体、人物、文字或水印,使用方便且免费。
DeepFloyd IF 是一个模块化的项目,由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示,模型便会根据输入生成高分辨率图像。
PromptoMANIA是一个AI艺术提示生成器,旨在帮助用户创建令人惊叹、详细且可重复的图像。它支持多种文本到图像的扩散模型,如CF SPARK、Midjourney和Stable Diffusion,提供用户友好的提示构建工具和网格分割工具,允许用户列出细节并参考人物、物体和地点。
SeedEdit 是一款免费的 AI 图像编辑工具,用户可以通过简单的提示来轻松编辑图像。它具有友好的界面,使得图像编辑变得更加直观和便捷。
Pixela AI是一款前沿的人工智能工具,专注于图像识别和处理,通过先进的算法提供以前无法实现的洞察和增强,旨在提升图像相关工作流程的效率和效果,适用于广泛的用户群体,包括技术爱好者和专业图形设计师。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型