DPT(Dense Prediction Transformer)是一个基于视觉Transformer的密集预测模型,主要用于单目深度估计和语义分割任务。该项目由Intel开发,但目前已停止维护。它提供了多种预训练模型,可以用于生成图像的深度图或进行语义分割。项目依赖于PyTorch框架,并提供了详细的代码和模型权重供用户使用。