所有AI工具AI图像工具AI开源项目

GeneralistYOLO开源项目 – 实时多任务视觉语言模型

GeneralistYOLO是一个实时多任务视觉语言模型,能够一站式解决多种视觉任务。该模型在MS COCO数据集上表现出色,目标检测AP达到52.4%,实例分割AP达到43.0%。此外,该模型具有高效...

标签:

AI交流(进群备注:GeneralistYOLO)

GeneralistYOLO是一个实时多任务视觉语言模型,能够一站式解决多种视觉任务。该模型在MS COCO数据集上表现出色,目标检测AP达到52.4%,实例分割AP达到43.0%。此外,该模型具有高效的实时性能,在640尺寸下FLOPs仅为122.2G。

GeneralistYOLO的特点:

  • 1. 单模型支持目标检测、分割、图像描述等多任务
  • 2. MS COCO数据集上目标检测AP达52.4%,实例分割AP达43.0%
  • 3. 实时性能,640尺寸下FLOPs仅122.2G

GeneralistYOLO的功能:

  • 1. 目标检测
  • 2. 实例分割
  • 3. 图像描述

相关导航

暂无评论

暂无评论...