2025年最强大的10个扩散模型AI工具推荐 | 第 2 页

ComfyUI-TeaCache开源项目 – 加速推理的 ComfyUI 插件

集成了 TeaCache 的 ComfyUI 插件，用于加速图像、视频和音频扩散模型的推理过程，支持多种模型，并提供了简单的安装方法和推荐配置

0

ComfyUI插件加速推理性能优化扩散模型

diffusers-torchao开源项目 – 优化扩散模型的端到端方案

利用torchao和diffusers优化扩散模型的端到端方案，支持推理和FP8训练，旨在提升模型的性能和效率。

0

diffusersFP8训练torchao扩散模型

DiffGS开源项目 – 功能性高斯喷溅扩散

DiffGS是一个功能性高斯喷溅扩散项目，旨在通过扩散模型生成高质量的图像。其核心技术围绕高斯喷溅的数学原理，能够在图像生成领域提供创新的解决方案。

0

功能性高斯喷溅扩散扩散模型高质量图像生成

Neural Network Diffusion官网 – 利用扩散模型生成高性能神经网络参数

该项目展示了如何利用扩散模型生成高性能的神经网络参数。通过自动编码器提取潜在表示，并训练扩散模型从随机噪声合成这些表示，从而生成新的网络参数子集。

0

图像生成扩散模型神经网络参数生成自动编码器

diffusion-rs开源项目 – 极速推理工具

扩散模型的极速推理工具，能快速处理复杂的图像生成任务，提升模型运行效率

0

图像生成工具扩散模型模型微调高效推理

DreamSampler开源项目 – 统一扩散采样与评分蒸馏技术

DreamSampler结合了扩散采样和评分蒸馏技术，旨在实现图像处理中的图像生成与操控。该项目可以通过生成模型实现图像生成，并运用基于评分的技术对现有图像进行操控，提供了强大的图像编辑和生成能力。

0

图像生成图像编辑扩散模型评分蒸馏

DeepCompressor开源项目 – 大型语言模型和扩散模型的压缩工具

DeepCompressor是一个专为大型语言模型和扩散模型设计的模型压缩工具箱，支持多种数据类型的假量化，旨在提高模型的推理速度和效率。

0

大型语言模型扩散模型推理速度优化模型压缩工具

Cosmos开源项目 – 物理AI开发者的世界基础模型平台

专为物理AI设计的世界基础模型平台，旨在帮助物理AI开发者更好更快地构建物理AI系统。

0

扩散模型模型训练与微调物理AI开发平台自回归模型

IDM-VTON开源项目 – 提升真实感的虚拟试穿模型

IDM-VTON项目旨在通过改进的扩散模型，提升服装试穿的保真度与真实感，生成高质量的虚拟试穿图像，结合高级语义与低级特征，增强视觉效果的真实性，并通过详细的文字提示优化生成结果。

0

扩散模型文字提示优化服装试穿虚拟试穿模型

RectifiedFlow开源项目 – 简单统一的扩散与流模型代码库

RectifiedFlow是一个简单统一的PyTorch代码库，专注于扩散和流模型，提供易于使用的平台用于训练和推理，强调简洁性、灵活性和快速原型设计。

0

PyTorch代码库快速原型设计扩散模型流模型

Awesome-Conditional-Diffusion-Models开源项目 – 条件图像合成扩散模型论文集合

收集了大量关于条件图像合成扩散模型论文的大列表，适用于研究人员和开发者，提供丰富的研究资源和参考资料。

0

扩散模型条件图像合成研究资源论文集合

HandDiff开源项目 – 基于扩散模型的3D手势估计

HandDiff是一种利用扩散模型进行3D手势估计的方法，结合图像和点云数据，实现精确的手势识别和追踪。该项目致力于提升虚拟现实和增强现实中的人机交互体验。

0

3D手势估计人机交互增强现实扩散模型

CRATE开源项目 – 高效稀疏率降低的可解释Transformer

CRATE是一个完全数学可解释的白盒Transformer模型，旨在通过统一多种模型架构实现高效的稀疏率降低，已在真实世界数据集ImageNet-1K上取得接近的性能。它整合了Transformer模型、自注意力、扩散模型和降噪技术，并通过展开迭代优化导出深层网络层。

0

可解释Transformer模型图像分类扩散模型稀疏率降低

AnyText开源项目 – 多语言视觉文本生成与编辑

AnyText 是一款支持多语言的视觉文本生成与编辑工具，能够用AI生成或编辑图片中的文字，并与图片风格保持一致，尤其支持中文。它基于扩散模型，集成了辅助潜在模块和文本嵌入模块，使用先进的训练技术，提供了大规模多语言文本图像数据集 AnyWord-3M。

0

AI文本编辑工具AnyWord-3M数据集多语言视觉文本生成扩散模型

ShEPhERD开源项目 – 创新的药物分子设计AI工具

一个创新的药物分子设计AI工具，通过扩散模型学习分子的3D结构、形状、静电特性和药效团的联合分布。

0

3D分子生成扩散模型药物分子设计AI工具药物设计与优化

GenAI Book开源项目 – 生成式AI学习资源与实践

《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库，包含完整的代码示例和练习答案，适合想要系统学习生成式AI的开发者使用。

0

Transformers代码示例实践应用扩散模型

meta-prompts开源项目 – 利用元提示优化视觉感知

meta-prompts是一种利用扩散模型处理视觉感知任务的方案，通过引入可学习的元提示到预训练的扩散模型中，以提取适合特定感知任务的特征。该方法旨在提高模型在各种视觉任务中的表现，支持丰富的语义信息提取，满足类别识别、深度感知和关键点感知等需求。

0

元提示优化图像理解定制化训练扩散模型

SLD开源项目 – 自校正的图像编辑与生成工具

自校正 LLM 控制的扩散模型，用于自动编辑任何图像或修复生成模型的文本到图像错位，无需额外训练。

0

LLM集成检测器扩散模型文本到图像生成自校正图像编辑工具

Human Motion Diffusion Model开源项目 – 基于扩散模型的人体运动生成

《人体运动扩散模型》的论文代码，旨在高效生成和编辑人体运动，支持多种运动风格和动作捕捉数据。

0

人体运动生成动作捕捉数据动画制作扩散模型