一、简介

  • MS-COCO 数据集是微软构建的一个数据集,其包含 detection, segmentation, keypoints 等任务

  • MS-COCO 总共包含 91 个类别(检测任务使用 80 类),每个类别的图片数量如下:
    请添加图片描述

  • PASCAL VOC 数据集相比:

    • COCO 中的图片包含了自然图片以及生活中常见的目标图片,背景比较复杂,目标数量比较多,目标尺寸更小,因此 COCO 数据集上的任务更难
    • COCO 数据集平均每张图片包含 3.5 个类别和 7.7 个实例目标,仅有不到 20% 的图片只包含一个类别,仅有 10% 的图片包含一个实例目标;而 PASCAL VOC 数据集平均每张图片仅包含 1.4 个类别和 2.3 个实例目标,有多于 70% 的图片上都只有一个类别

二、MS-COCO 数据下载及组织结构


三、评估标准

请添加图片描述

  • COCO 中的 AP 是指在 10 个 IOU 层面(0.5 到 0.95 每变化 0.05 就测试一次 AP)及 80 个类别层面的平均值
  • COCO 还针对 三种不同大小(small,medium,large) 的图片提出了测量标准,COCO 中包含大约 41% 的小目标 ( a r e a < 32 × 32 area < 32×32 area<32×32),34% 的中等目标 ( 32 × 32 < a r e a < 96 × 96 32×32 < area < 96×96 32×32<area<96×96),和 24% 的大目标 ( a r e a > 96 × 96 area > 96×96 area>96×96)

四、参考资料

1、MS-COCO 官网
2、MS-COCO 数据集使用和模型评估的代码
3、目标检测数据集 MS-COCO 简介
4、MS-COCO 数据集格式简介

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐