Sapiens 是由 Meta 开发的一种新型人类视觉模型,旨在通过深度学习技术模拟人类视觉感知。它基于大量图像数据和高级算法,支持 1K 高分辨率推理,适合多种人类相关的视觉任务。该项目在二维姿态估计、身体部位分割、深度估计和表面法向量预测等任务上表现出色,尤其在野外数据上的泛化能力显著。Sapiens 通过预训练于超过 3 亿张野外人类图像,展示了卓越的性能,并通过简单微调适应各种任务。
Meta开源的Sapiens模型,专门用于处理人体视觉任务,具备多种功能和优越的性能,能够在缺少标注数据的情况下实现高精度的输出。
Sapiens是一系列专门针对人类的视觉基础模型,所有权重开放,提供各种尺寸的分割、深度和主题模型,旨在推动计算机视觉领域的发展。
UniMVSNet是一种统一的深度估计方法,旨在改进多视图立体的准确性,能够在不同条件下保持稳健的性能。
一个自定义 Hugging Face 节点的开源项目,用于 Google Visual Blocks for ML,允许用户在无代码图形编辑器中创建机器学习管道,支持多种机器学习功能并与Hugging Face Serverless API集成。
DINOv2是Meta AI开发的最先进计算机视觉模型,具有自监督学习功能,无需大量标注数据即可训练。它能够直接从图像中学习特征,适用于图像分类、分割、检索和深度估计等多种任务。DINOv2的预训练版本已上线,与CLIP和OpenCLIP等模型竞争,并在众多任务中表现出色。
GrUMoDepth 是一种通过梯度方法进行的不确定性估计,专注于单目深度估计,旨在提高深度估计的准确性和可靠性。
ZeST是一种零样本、免训练的方法,用于图像到图像的材料传输。它可以轻松扩展以在单个图像中执行多种材质编辑,并对纹理网格的渲染执行隐式照明感知编辑。
Lionvaplus是一个基于AI的工具,提供经济、高效的解决方案,能够在各种环境中创建产品的逼真图像,无需昂贵的拍摄。用户可以在几分钟内生成高度真实和可定制的图像。
AIGS是一个强大的工具,能够生成高质量的合成图像,支持多种图像生成模型,易于集成到现有的数据处理工作流中,并提供多种图像处理和分析工具。
Spline AI是一个利用人工智能重塑3D设计的创新平台,适合个人创意者和专业团队,提供快速直观的3D对象、动画和纹理创作。
Draw3D通过将简单草图转化为高度真实感的图像,彻底改变了数字艺术的世界。专为艺术家、设计师和创意专业人士设计,该AI驱动工具简化了从基本草图创建生动图像的过程。无论是细致的自然场景、风景还是雕塑变换,Draw3D都能轻松实现将想象力变为现实。