图像扩散技术

Deep floyd开源项目 – 基于文本生成高分辨率图像

Deep floyd开源项目 – 基于文本生成高分辨率图像

DeepFloyd IF 是一个模块化的项目，由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示，模型便会根据输入生成高分辨率图像。

图像扩散技术文本生成图像模块化设计高分辨率图像生成

diffusers-webui开源项目 – 基于Gradio的Stable Diffusion图像生成界面

diffusers-webui开源项目 – 基于Gradio的Stable Diffusion图像生成界面

diffusers-webui是一个基于Gradio构建的Web用户界面，旨在与Stable Diffusion的Diffusers格式协同工作，提供简单易用的图像生成体验。用户可以通过图形界面轻松上传模型、调整参数，并实时预览生成的图像。

Diffusers格式支持Stable Diffusion图像生成基于Gradio的图像生成界面实时图像预览

diffusers开源项目 – HuggingFace的多模态生成工具包

diffusers开源项目 – HuggingFace的多模态生成工具包

Diffusers是HuggingFace官方推出的生成模型工具包，集成了Stable Diffusion 3、DALL-E 3等前沿模型，支持文生图、图生图、视频生成等全流程。该库支持多种新功能和pipeline，包括UniDiffuser、DiffEdit、IF DreamBooth和A1111 LoRA等，适用于数字内容创作、工业设计原型生成和教育可视化内容制作等领域。

A1111 LoRADiffEditHuggingFaceIF DreamBooth

DALL·E 2官网

OpenAI旗下DALL·E 2模型

AI图像工具

PULSE开源项目 – 将模糊人脸转为清晰图像

PULSE开源项目 – 将模糊人脸转为清晰图像

杜克大学的开源项目PULSE，可以让很模糊的人变清晰的脸（当然非真实还原），基于深度学习技术，支持多种输入格式，社区积极贡献。

开源图像处理工具模糊人脸图像清晰化深度学习图像生成

Stable Diffusion 3.5开源项目 – 快速生成高质量图像的AI模型

Stable Diffusion 3.5开源项目 – 快速生成高质量图像的AI模型

Stable Diffusion 3.5是一款用于简单推理的AI模型，能够快速生成高质量的图像，支持多种文本编码器和核心MM-DiT技术，让图像生成变得更加便捷。

AI图像生成模型文本描述生成图像高质量图像生成

Diffusion AI官网 – 将文字变为视觉艺术的AI软件

Diffusion AI 是一款基于人工智能的Windows软件，通过简单的文本输入将创意转化为惊艳的视觉图像，帮助用户释放创造力，生成高质量的视觉效果。

AI生成视觉艺术创意设计软件文本转图像工具

ClarityWrite官网 – 一站式AI内容创作平台

ClarityWrite是一个集成AI技术的内容创作平台，专为市场营销人员、企业家和创作者设计。它能够生成高质量的书面、视觉和代码内容，配备了内置模板、AI机器人和图像生成工具，帮助用户消除写作障碍，提供无限的内容创作可能性。

AI内容创作平台个性化内容定制代码片段开发社交媒体图形创建

Ask Vandelay – AI Architecture Image Generator-将文字提示转化为建筑图像

Ask Vandelay 是一个先进的 AI 建筑图像生成器，能够将简单的文字提示转化为惊艳的高质量建筑图像。它为建筑师、房地产开发商和设计师节省时间，提升创意。

AI建筑图像生成器创意设计辅助建筑设计工具文字提示转化为图像

Fine-tune Phi-2-对Phi开源项目 – 2模型进行微调的实例

Fine-tune Phi-2-对Phi开源项目 – 2模型进行微调的实例

Fine-tune Phi-2是一个用于对Phi-2模型进行微调的项目，包含使用QLoRA技术进行微调、创建合成对话数据集以及支持多个GPU并行训练的功能。该项目提供了详细的示例代码和文档，允许用户灵活配置训练参数，以便优化模型的表现。

QLoRA微调合成对话数据集多GPU训练模型优化

JoyTag开源项目 – 开源图像标注模型，注重积极性和包容性

JoyTag开源项目 – 开源图像标注模型，注重积极性和包容性

JoyTag是一个开源图像标注模型，专注于积极性和包容性，使用Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。该模型基于ViT-B/16架构，经过660M个样本的训练，支持5000多个标签，能够对输入图像输出对5000多个不同标签的预测结果。

ViT-B/16架构开源图像标注模型数据集整理积极性和包容性

Stable Video Diffusion开源项目 – 本地生成高质量视频的模型

Stable Video Diffusion开源项目 – 本地生成高质量视频的模型

Stable Video Diffusion 是一个可以本地部署的视频生成模型，旨在通过先进的生成技术创建高质量视频内容。该项目基于生成对抗网络(GAN)技术，支持多种输入格式，能够生成多样化的视频内容，并集成了多种预训练模型，便于用户快速上手。

本地视频生成模型生成对抗网络用户友好接口预训练模型

AItoZee – Your Creative AI Playground-一切创意的AI平台

AItoZee是一个全方位的AI内容创作平台，提供多种工具，帮助用户轻松生成高质量的AI驱动内容。

AI代码生成AI内容创作平台AI写作助手图像生成

Alby.email官网 – 智能邮件助手

Alby.email是一个基于AI的工具，通过电子邮件提供快速准确的响应，支持多种功能，如写邮件、生成广告文案、创建图像、翻译语言、创意生成等。

AI邮件助手创意生成图像生成广告文案生成

imageflow开源项目 – 高性能图像处理的Web服务器

imageflow开源项目 – 高性能图像处理的Web服务器

imageflow 是一个用于 Web 服务器的高性能图像处理工具，支持多种图像处理功能，能够高效地处理图像请求。

Web图像处理服务命令行图像处理工具图像处理库高性能图像处理工具

Chandler官网 – 实惠的个人AI助手

Chandler是一个经济实惠的个人AI助手，旨在回答您的任何问题，具备图像生成和数据分析功能。

Chrome扩展个人AI助手图像生成提高工作效率

DreamSampler开源项目 – 统一扩散采样与评分蒸馏技术

DreamSampler开源项目 – 统一扩散采样与评分蒸馏技术

DreamSampler结合了扩散采样和评分蒸馏技术，旨在实现图像处理中的图像生成与操控。该项目可以通过生成模型实现图像生成，并运用基于评分的技术对现有图像进行操控，提供了强大的图像编辑和生成能力。

图像生成图像编辑扩散模型评分蒸馏

cisip-FIRe开源项目 – 促进图像检索研究的开源项目

cisip-FIRe开源项目 – 促进图像检索研究的开源项目

Fast Image Retrieval (FIRe) 是一个开源项目，旨在促进图像检索研究，提供高效的图像搜索和特征提取功能。

图像检索算法图像特征提取开源图像检索项目高效图像搜索

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3