Diffuse to Choose开源项目 – 高效图像修复与虚拟试穿

Diffuse to Choose是一种基于扩散模型的图像条件修复技术，专为虚拟试穿场景设计，能够在快速推理的同时保持高保真细节，并确保语义操作的准确性。该模型通过将参考图像的细粒度特征直接合并到主扩散模型的潜在特征图中，并使用感知损失进一步保留参考项的细节，从而在图像修复和增强方面表现出色。

Diffuse to Choose的特点:

1. 高效平衡快速推理与高保真细节保留
2. 将参考图像中的细粒度特征直接合并到主扩散模型的潜在特征图中
3. 使用感知损失进一步保留参考项的细节
4. 优于现有的零镜头扩散修复方法及少镜头扩散个性化算法

Diffuse to Choose的功能:

1. 在线购物中的虚拟试穿
2. 图像修复与增强
3. 实时应用程序中的图像处理

相关导航

Inzack官网 – 在线时尚平台，一键试穿服装设计

Inzack平台是一个在线时尚平台，用户可以通过简单的点击尝试不同的衬衫和裤子设计。用户只需浏览可用的设计，选择自己喜欢的款式，点击“试穿”按钮即可虚拟试穿所选的衬衫和裤子。用户还能根据个人喜好自定义尺寸、颜色和图案。

Image-Processing-Node-Editor开源项目 – 基于节点的图像处理应用

一个可以通过节点编辑器进行图像处理的应用，支持多种图像和视频格式，提供实时处理和预览功能，具有模块化设计，允许用户创建自定义节点，界面友好，支持拖放操作。

Inf-DiT开源项目 – 基于扩散模型的图像上采样方法

Inf-DiT 是清华大学与智谱AI联合推出的基于扩散模型的图像上采样方法，能够生成超高分辨率图像。该模型引入了单向块注意力机制(UniBA)，将生成过程中的空间复杂度从 O(N^2)降低到 O(N)，有效解决了传统扩散模型在生成大尺寸图像时内存消耗过高的问题。Inf-DiT 采用扩散变换器(DiT)结构，能够处理各种形状和分辨率的图像上采样任务，并通过全局图像嵌入和邻近低分辨率块的交叉注意力机制等技术，增强图像的局部和全局一致性。实验结果表明，Inf-DiT 在超高分辨率图像生成和超分辨率任务中均达到了 SOTA 性能。

Virtual Staging官网 – 专业房地产照片编辑解决方案

Revivoto是一个为房地产行业专业人士提供照片编辑解决方案的平台，专注于房地产照片编辑、虚拟布景、360°虚拟布景等服务。用户可以上传照片并选择所需的服务，编辑完成后在24小时内收到处理好的照片。

OutfitAnyone开源项目 – 阿里巴巴开发的2D虚拟试穿框架

OutfitAnyone是由阿里巴巴开发的基于扩散模型的2D虚拟试穿框架，旨在解决现有虚拟试穿技术在生成高保真、细节一致结果时遇到的挑战。该项目支持任何服装和任何人的虚拟试穿，具有广泛的应用场景，如电商、时尚设计等。项目目前已在ModelScope和Hugging Face上提供体验版本，用户可以通过上传服装图像进行虚拟试穿。

Cosmos开源项目 – 物理AI开发者的世界基础模型平台

专为物理AI设计的世界基础模型平台，旨在帮助物理AI开发者更好更快地构建物理AI系统。

Neural Network Diffusion官网 – 利用扩散模型生成高性能神经网络参数

该项目展示了如何利用扩散模型生成高性能的神经网络参数。通过自动编码器提取潜在表示，并训练扩散模型从随机噪声合成这些表示，从而生成新的网络参数子集。

texture-diffusion开源项目 – 自动化纹理生成的Blender插件

一个强大的Blender插件，利用扩散模型实现自动化纹理生成。该插件能够直接在Blender内为3D模型生成高质量的纹理，同时支持局部重绘、LoRA模型和IP-Adapter的应用。通过深度ControlNet技术，确保生成的纹理与3D几何特征相符，且支持多纹理着色和UV投影等高级功能，极大地提升了3D创作的效率和质量。

Pixela AI官网 – 智能图像处理工具

Pixela AI是一款前沿的人工智能工具，专注于图像识别和处理，通过先进的算法提供以前无法实现的洞察和增强，旨在提升图像相关工作流程的效率和效果，适用于广泛的用户群体，包括技术爱好者和专业图形设计师。

Diffusion Policy开源项目 – 基于扩散模型的视动策略学习

Diffusion Policy 是一种利用扩散模型进行视动策略学习的方法，探索了扩散模型在策略学习中的应用。它提出了一种新的训练算法和架构，并在模拟和真实世界实验任务中表现出色，能够实现更高的成功率和更快速、更有效的学习。项目提供了完整的代码、实验数据和Google Colab笔记本，支持用户快速上手和复现实验结果。

Adapt or Perish: Adaptive Sparse Transformer with Attentive Feature Refinement for Image Restoration开源项目 – 自适应稀疏变换器用于图像修复

本项目专注于利用自适应稀疏变换器进行图像修复，采用细致的特征精炼技术，旨在优化图像修复任务的性能。

可灵 AI官网 – 快手推出的视频生成AI

可灵 AI 是由快手推出的大型视频生成模型，专注于视频和图像生成，2024 年 6 月推出测试版，截至 2024 年 11 月，累计用户超过 360 万，生成 3700 万视频和 1 亿张图像。平台提供视频生成、图像生成和虚拟试穿等 API 服务，并不断扩展面向企业的商业化渠道。技术基于快手自研的 Keling 和 Ketu 大模型，采用类似 Sora 的 DiT 结构，提升生成效率和质量。

BD3-LM开源 – 结合自回归与扩散模型的语言模型

BD3-LM（Block Diffusion Language Model）是一种创新的语言模型，旨在通过结合自回归模型和离散扩散模型的优点，显著提升语言建模任务的性能。它通过在token块上执行自回归，并在每个块内进行离散扩散，实现了灵活且高效的建模方式。该模型特别适用于生成任意长度的序列，展现了其在自然语言处理领域的潜力。