NanoSAM是一个经过蒸馏的Segment Anything (SAM)模型,能够在NVIDIA TensorRT上实现实时推理,适用于各种图像分割任务。
该网络旨在利用跨模态知识蒸馏技术进行单目3D目标检测,以提高目标检测任务的准确性。
该项目专注于开发持续的场景表示,以增强具身AI系统的能力,支持实时场景理解和动态环境中的导航与交互。
在多个粒度上分割和识别物体的通用图像分割模型。团队在SA-1B数据集、通用分割数据集(COCO等)和部件分割数据集(PASCAL Part等)上联合训练模型的首次尝试,并系统研究了在SA-1B上定义的交互分割任务和其他分割任务(如全景分割和部件分割)上多任务联合训练的相互促进作用。
这个项目能分析图像中对象之间的关系,是一个将Meta的Segment-Anything模型与ECCV'22论文相结合的演示:Panoptic Scene Graph Generation。
FieldDay是一个平台,使任何人都可以创建视觉AI。用户可以根据自己的专业知识收集定制数据集,通过迭代训练完善算法,最后将AI模型与自己喜欢的工具或工作流程集成。
Zoom Media Asset Management System是Evolphin公司提供的一款数字资产管理和媒体资产管理解决方案,专为创意、市场营销和IT团队设计。该软件简化了图像、音频和视频的工作流程,提供先进的人工智能功能、快速搜索、强大的版本控制及Adobe插件等多种功能,帮助团队高效管理创意管道中的各类资产。
UniAD是一个为自动驾驶设计的框架,旨在实现感知与决策一体化,开创全局任务为目标的自动驾驶架构。
SLABIM是一个开源的SLAM数据集,结合了建筑信息建模(BIM),适用于室内环境中的机器人定位和地图绘制。该数据集为SLAM算法的训练和测试提供了全面的支持,能够适应多种室内环境,促进强大的机器人定位和地图绘制解决方案的开发。