Ultralytics YOLO 是一款基于 YOLO 系列的尖端对象检测和追踪模型,集成了计算机视觉和深度学习的最新进展。它继承了前代 YOLO 版本的成功,并引入了新的架构和训练流程,提升了实时推理速度、准确性和泛化能力。该模型适用于广泛的任务,包括对象检测、实例分割、图像分类和姿态估计。YOLO11 经过 COCO、ImageNet 和 DOTAv1 等大型数据集的训练,提供了卓越的准确度和速度。
detectron2-ResNeSt是基于Detectron2框架的一个分支,集成了ResNeSt骨干网络。该项目旨在通过引入ResNeSt网络,增强目标检测能力,特别是在复杂场景下的特征提取效果。它不仅支持目标检测和实例分割等下游任务,还允许用户使用ResNeSt骨干网络训练自定义模型,并在标准数据集上进行性能基准测试。
Detectron2是一个开源的PyTorch视觉库,专注于目标检测和实例分割等任务。它在训练速度上较传统方案提升了40%,并在COCO数据集上实现了57.9%的mAP指标。该库支持分布式训练优化、实时推理加速和可扩展架构,适用于多种应用场景。
GeneralistYOLO是一个实时多任务视觉语言模型,能够一站式解决多种视觉任务。该模型在MS COCO数据集上表现出色,目标检测AP达到52.4%,实例分割AP达到43.0%。此外,该模型具有高效的实时性能,在640尺寸下FLOPs仅为122.2G。
BoundaryFormer是一个利用掩码监督的多边界变换器,专注于实例分割任务。该项目通过多边形边界的学习,提升了实例分割的精度和效率。
PatchDCT是用于高质量实例分割的补丁细化技术,旨在提高图像分割的精度和效果。该项目利用补丁细化方法,增强了实例分割的性能,适用于多种图像处理任务。
融合图像聊天、分割和生成/编辑的AI应用概念验证项目,基于LLaVA、SEEM和GLIGEN三个相关开源项目实现。
Segment Matting项目旨在利用SAM(Segment Anything Model)模型提升图像抠图的质量和性能,专注于优化抠图过程,减少锯齿边缘,提升分割的整体准确性。
3PSDF是一个用于学习任意拓扑表面的签名距离函数的项目,采用三极点方法,能够高效地重建复杂表面。