语义分割

DPT开源项目 – 密集预测的视觉Transformer

DPT开源项目 – 密集预测的视觉Transformer

DPT（Dense Prediction Transformer）是一个基于视觉Transformer的密集预测模型，主要用于单目深度估计和语义分割任务。该项目由Intel开发，但目前已停止维护。它提供了多种预训练模型，可以用于生成图像的深度图或进行语义分割。项目依赖于PyTorch框架，并提供了详细的代码和模型权重供用户使用。

PyTorch框架单目深度估计密集预测模型视觉Transformer

pytorch-image-models开源项目 – 高效易用的计算机视觉库

pytorch-image-models开源项目 – 高效易用的计算机视觉库

Timm是一个开源的计算机视觉库，专注于提供高效且易用的深度学习模型，涵盖了图像分类、目标检测、语义分割等任务，支持多种预训练的模型，广泛应用于各类视觉任务。

图像分类深度学习模型目标检测计算机视觉库

Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation – “Facilitating animation and film production”-从声音生成3D面部模型

Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation – “Facilitating animation and film production”-从声音生成3D面部模型

该系统通过声音输入生成跨模态的3D面部模型，支持多种语音输入。

AI生成3D面部模型对话系统机器人应用语义分割

CoreNet开源项目 – 苹果深度神经网络训练库

CoreNet开源项目 – 苹果深度神经网络训练库

CoreNet 是苹果公司开发的开源深度神经网络工具包，支持训练多种标准和新颖的小型和大型模型。它适用于对象分类、对象检测和语义分割等多种任务，允许研究人员和工程师使用基础模型（如 CLIP 和 LLM）进行高效的深度学习研究。

对象分类对象检测开源深度学习工具深度神经网络训练库

FeatUp官网 – 恢复深层特征的空间信息

FeatUp 是一个与任务和模型无关的框架，用于恢复深层特征中丢失的空间信息，能够将任何模型特征的空间分辨率提高16-32倍，而无需改变其语义。

图像超分辨率深层特征空间信息恢复特征恢复框架语义分割

SegViT开源项目 – 基于纯视觉变换器的语义分割

SegViT开源项目 – 基于纯视觉变换器的语义分割

SegViT是一个基于纯视觉变换器的语义分割项目，旨在提高图像分割任务的效率和性能。它能够处理多种图像分割任务，适应不同的应用场景，为研究人员和开发者提供了强大的工具。

图像分析工具视觉变换器计算机视觉项目语义分割

SegModel开源项目 – 轻量级深度学习分割库

SegModel开源项目 – 轻量级深度学习分割库

SegModel是一个基于Caffe的轻量级深度学习库，专注于语义分割任务，具有高效的架构，支持结构化补丁预测，并结合了上下文条件随机场（CRF）和引导CRF技术，方便与现有Caffe项目集成。

Caffe集成CRF技术结构化补丁预测语义分割

GroupMixFormer开源项目 – 高效视觉任务神经网络架构

GroupMixFormer开源项目 – 高效视觉任务神经网络架构

GroupMixFormer是一种高效神经网络架构，基于Group-Mix Attention机制，旨在显著提升各种视觉任务的性能，特别是在图像分类、目标检测和语义分割等领域。

Group-Mix Attention图像分类目标检测语义分割

BasicAI Cloud官网 – AI驱动的数据标注解决方案

BasicAI Cloud是一个提供AI驱动的训练数据解决方案的平台，专注于数据标注服务，连接AI工程师与标注专家，提升AI和机器学习模型的准确性。该平台拥有超过7年的经验，提供自动标注、对象跟踪和可扩展标签管理等功能。

3D边界框创建AI驱动的数据标注解决方案团队协作对象跟踪

OpenVINO™ AI Plugins for GIMP开源项目 – GIMP的强大AI插件

OpenVINO™ AI Plugins for GIMP开源项目 – GIMP的强大AI插件

GIMP的OpenVINO™ AI插件，功能包括超分辨率、风格迁移、修补、语义分割和Stable-Diffusion等，帮助用户提升图像处理能力，创造出更具艺术感的作品。

GIMP插件Stable-Diffusion图像修补语义分割

GFPGAN开源项目

GFPGAN开源项目

GFPGAN是腾讯开源的AI模型，旨在恢复老照片。用户可以通过上传老照片到测试地址，并使用GFPGAN进行图像修复和恢复。

AI图像工具AI开源项目

SemanticStyleGAN开源项目 – 可控图像合成与编辑

SemanticStyleGAN开源项目 – 可控图像合成与编辑

SemanticStyleGAN是一个用于可控图像合成和编辑的生成模型，它学习组合生成先验，从而实现对图像风格的精确控制。

可控图像合成图像编辑生成模型风格控制

Stable Diffusion Conceptualizer官网 – 强大的SD风格图像生成工具

Stable Diffusion Conceptualizer集合了众多非常好用的SD Text Inversion插件，这些插件可用于SD生成不同风格的图片。它提供用户友好的界面，支持多种风格的图像生成，并且能够输出高质量的图像，非常适合艺术创作和设计项目使用。

SD风格图像生成工具艺术创作设计项目高质量图像输出

Stablecog官网 – 简单易用的AI图像生成工具

Stablecog是一个基于Stable Diffusion的免费开源工具，旨在让用户轻松创建高质量图像，激发创意并实现想象力。

AI图像生成工具多样化艺术风格支持开源图像生成项目艺术创作工具

NeuralPix官网 – 最受欢迎的AI照片增强应用

NeuralPix是一款免费的应用程序，集成了多种流行的AI照片增强功能，用户可以通过拍照、导入已有照片或扫描旧照片来进行图像处理。

AI照片增强应用人像照片增强对象擦除工具旧照片修复

PicTush官网 – 智能图像增强助手

PicTush是一个基于AI的图像处理工具，提供图像放大、上色和转化等功能，利用尖端的人工智能技术彻底改变视觉效果。

一键编辑修复旧照片去除背景图像放大

Z∗: Zero-shot Style Transfer via Attention Rearrangement开源项目 – 无监督样式迁移方法

Z∗: Zero-shot Style Transfer via Attention Rearrangement开源项目 – 无监督样式迁移方法

一种通过注意力重排列实现零样式迁移的方法，无需针对每种样式的训练数据。

图像处理图形设计注意力机制零样式迁移

Real开源项目 – ESRGAN

Real开源项目 – ESRGAN

Real-ESRGAN是一个开源的AI项目，其主要功能是实用的图像/视频修复算法。

AI图像工具AI开源项目

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3