2025年最强大的单目深度估计AI工具推荐

Depth Anything 是一个高度实用的单目深度估计解决方案，旨在构建一个简单而强大的基础模型，能够处理任何图像并适应任何场景。该模型使用约6200万张无标签图像进行训练，涵盖多个领域和场景，展示了出色的零样本泛化能力，并在NYUv2和KITTI数据集上创下了新的最佳性能。

0

3D场景理解单目深度估计增强现实工具自动驾驶辅助

DPT开源项目 – 密集预测的视觉Transformer

DPT（Dense Prediction Transformer）是一个基于视觉Transformer的密集预测模型，主要用于单目深度估计和语义分割任务。该项目由Intel开发，但目前已停止维护。它提供了多种预训练模型，可以用于生成图像的深度图或进行语义分割。项目依赖于PyTorch框架，并提供了详细的代码和模型权重供用户使用。

0

PyTorch框架单目深度估计密集预测模型视觉Transformer

DepthFM开源项目 – 快速单目深度估计模型

DepthFM 是一个先进、多功能且快速的单目深度估计模型，能够在单次推理步骤中生成高质量的深度图。该模型展示了从基础图像合成扩散模型（Stable Diffusion v2-1）到流匹配模型的成功迁移，直接从输入图像映射到深度图。DepthFM 不仅在常规深度估计任务中表现出色，还在深度修复和深度条件合成等下游任务中展现了领先的能力。

0

单目深度估计开源项目流匹配模型深度图生成

Depth Anything V2开源项目 – 单目深度估计的强大基础模型

Depth Anything V2 是一种单目深度估计的强大基础模型，显著改善了细节刻画和鲁棒性。它提供更快的推理速度、更少的参数和更高的深度精度，适用于各种单目深度估计应用。项目提供了四种不同规模的预训练模型，支持图像和视频的深度估计，并且可以通过 Transformers 和 Apple Core ML 进行便捷的使用。

0

Apple Core MLTransformers单目深度估计开源项目

MMSegmentation开源项目 – 基于PyTorch的语义分割工具箱

MMSegmentation 是 OpenMMLab 项目的一部分，旨在为研究人员和开发者提供一个灵活、高效且标准化的平台，用于重新实现现有方法并开发新的语义分割算法。它支持多种流行的语义分割框架，如 PSPNet、DeepLabV3、PSANet、DeepLabV3+ 等，并且具有模块化设计，允许用户通过组合不同模块来构建自定义的语义分割框架。

0

OpenMMLab单目深度估计基于PyTorch开放词汇语义分割算法

Depth Pro开源项目 – 快速生成清晰深度图的基础模型

Depth Pro 是一个基础模型，用于零样本度量单目深度估计，能够在不到一秒的时间内生成清晰的深度图。它结合了真实和合成数据，利用高效的多尺度视觉变换器，提供高分辨率和准确的深度测量，适用于各种视觉任务。

0

单目深度估计增强现实多尺度视觉变换器机器人导航

GrUMoDepth开源项目 – 基于梯度的不确定性单目深度估计

GrUMoDepth 是一种通过梯度方法进行的不确定性估计，专注于单目深度估计，旨在提高深度估计的准确性和可靠性。

0

三维重建单目深度估计深度估计自动驾驶