SpatialLM-Llama-1B模型 – 开源空间理解模型
SpatialLM-Llama-1B 是由 Manycore Technology 开发的开源空间理解模型,专为处理 3D 点云数据设计。它能够从普通手机视频中在 30 秒内生成物理精确的 3D 场景布局,支持机器人、增强现实(AR)、虚拟现实(VR)等领域的快速空间理解。该模型具有高效推理能力,单场景处理速度比传统 LiDAR 扫描快 3 倍,GPU 内存占用低至 2GB。它支持从多种来源(如单目视频、RGBD 图像和 LiDAR 数据)处理 3D 点云,并生成结构化的场景描述。