AI交流(进群备注:GeneralistYOLO)

GeneralistYOLO是一个实时多任务视觉语言模型,能够一站式解决多种视觉任务。该模型在MS COCO数据集上表现出色,目标检测AP达到52.4%,实例分割AP达到43.0%。此外,该模型具有高效的实时性能,在640尺寸下FLOPs仅为122.2G。
GeneralistYOLO的特点:
- 1. 单模型支持目标检测、分割、图像描述等多任务
- 2. MS COCO数据集上目标检测AP达52.4%,实例分割AP达43.0%
- 3. 实时性能,640尺寸下FLOPs仅122.2G
GeneralistYOLO的功能:
- 1. 目标检测
- 2. 实例分割
- 3. 图像描述
相关导航
暂无评论...