该项目旨在通过多LiDAR布置来提高自动驾驶中物体检测的准确性,探索不同LiDAR配置对3D检测性能的影响。
DAIR-V2X是一个用于车辆与基础设施合作的3D物体检测的大规模数据集,旨在推动智能交通系统的发展,提供丰富的场景和多样的标签,以支持研究和应用。
UniMVSNet是一种统一的深度估计方法,旨在改进多视图立体的准确性,能够在不同条件下保持稳健的性能。
RT-DETR(Real-time DEtection Transformer)是一种在速度和准确率方面均超越YOLO系列的先进物体检测模型,旨在提升计算机视觉任务的效率和效果。该模型采用高效的混合编码器和不确定性最小查询选择方法,支持灵活的速度调整和多尺度特征处理,在COCO数据集上表现出色。
DoubleTake 是一个几何引导的深度估计项目,旨在高效处理稀疏视图,以提升计算机视觉任务中的深度估计精度。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型