该项目是一个专注于多模态大型语言模型(MLLM)和视觉语言模型(VLM)推理的综合资源库,汇集了最具影响力的论文、代码、数据集、基准测试和资源。旨在为研究人员和开发者提供一站式学习平台,涵盖Chain-of-Thought、OpenAI o1、DeepSeek-R1等前沿推理技术,包含20+顶级论文和实操项目资源。
该项目是一个专注于多视角3D空间预测的资源库,收集了超过100篇前沿论文和代码,涵盖CVPR、ICCV等顶级会议。特别适用于自动驾驶领域的3D场景理解,提供了一站式资源,方便研究人员访问最新方法及其实现。