Prompt Depth Anything 是一个专注于高分辨率深度估计的AI工具,旨在简化4K深度图的生成过程,并提升深度估计的精度和实用性。它通过低成本LiDAR作为提示,引导Depth Anything模型输出准确的度量深度,适用于3D重建和机器人抓取等场景。
书生项目是由上海人工智能实验室开发的开源AI大模型系列,涵盖自然语言处理、3D重建、教育辅助等多个领域。项目包括书生·浦语、书生·天际和书生·浦语灵笔等多个模型,旨在通过高质量开源资源促进AI技术创新和应用。书生系列模型具有超长文本处理、强化推理、自主信息搜索等功能,并提供免费商用授权,适应多样化应用需求。
GRM是一个用于3D重建和生成的大型高斯重建模型,能够在极短的时间内(约0.1秒)重建出精确的3D模型。它支持将文本或图像直接转换成3D模型,适用于多种应用场景。该项目由Yinghao Xu等人开发,相关代码和模型即将发布。
DUSt3R 是一种全新的3D立体重建方法,仅需两张图片即可完成3D建模,无需相机校准或视点姿态等先验信息。该项目提供了从图像对到3D点云的完整流程,支持多种分辨率和模型配置,适用于多种场景的3D重建任务。
gtracer是一个基于OptiX的可微3D高斯光线追踪工具,能够快速追踪粒子场景,并为3D重建提供技术支持。它采用高效的光线追踪算法,适用于复杂的3D场景重建,支持3D重建项目的技术开发与优化。
Fast3R是一个旨在通过单次前向处理实现1000+张图像的3D重建的项目,使得大规模3D重建变得轻松高效。
camp_zipnerf项目结合了CamP和Zip-NeRF技术,实现了从iPhone捕获的图像中创建高精度的3D空间。该项目通过使用ARKit估计的相机姿势和改进的BARF相机参数化,显著提升了图像质量和3D重建的准确性,达到了最先进的水平。它特别适用于AR/VR应用、NeRF技术研究以及需要高精度3D重建的场景。
UniMVSNet是一种统一的深度估计方法,旨在改进多视图立体的准确性,能够在不同条件下保持稳健的性能。
一个通过坐标映射进行相机定位的神经框架。
HyperNeRF是一个支持高维表示和处理拓扑变化的神经辐射场的项目,旨在提高3D重建和场景渲染的效果。
一种通过幂变量投影实现无初始化的大规模束调整的方法,能够高效处理大型数据集并提高调整精度。
VGGSfM是基于运动的视觉几何深层结构,旨在从输入图像中提取2D轨迹,通过图像和轨迹特征重建摄像机,初始化点云并应用捆绑调整层进行重建细化。
Gradient-SDF是一个半隐式表面表示项目,专注于3D重建,能够从图像中提取结构信息并生成高质量的三维模型。该项目利用先进的算法来实现高效的3D重建,适用于各种计算机视觉应用。
MultiPly是一个通过野外单目视频重建多人3D图像的项目,能够处理人物之间的遮挡和相互作用,使用先进的神经表征技术进行场景建模,并结合自监督的3D分割及可提示的2D分割模块,提供高效的人体姿势和形状优化。
shap-e是OpenAI开发的一个开源AI 3D算法,能够根据单张图像生成多个3D模型。它可以在高性能显卡上高效运行,生成的模型支持导出为mesh格式,便于在Blender等软件中进行再编辑,适用于各种形状和物体的建模需求。
MVDD利用多视角深度和扩散模型来表示复杂的三维形状,并将其映射到二维数据格式中。该模型能够生成高质量、密度较高的点云,包含细致的细节,点数可达20,000个以上。
Tripo是一款先进的AI工具,旨在革新3D建模和设计工作流程。通过自动化和增强3D模型的创建,Tripo为建筑、游戏、虚拟现实和产品设计等专业领域提供了不可或缺的支持。其核心功能是利用先进的AI算法简化复杂任务,使用户能够以空前的速度和精度生成高质量的3D模型。