KAIST 行人数据集预处理

一、KAIST 行人数据据简介

  • 数据集:
    KAIST 行人数据集中的每张图片都由一张可见光图片和与之对应的长波红外图像组成。
    KAIST 训练集由 50172 对在全天候(白天和夜间)采集的可见光与长波红外配对图像(分辨率为 640x512)和 13853 个行人矩形框标注组成。
    KAIST 测试集由2252 对可见光与长波红外配对图像和 1356 个行人矩形框标注组成,其中 1455 对图像在白天采集得到,797 对图像在夜间采集得到。

  • 标签
    数据集的标签中包含的类别有:person、people、cyclist三个类别。
    比较好区分的个体则被标注为person,不太好分辨的多个个体则被标注为people,骑行的人则被标注为cyclist。

下载链接

1. 数据集
  • Train

Set 00 / Day / Campus / 5.92GB / 17,498 frames / 11,016 objects [jpg]

Set 01 / Day / Road / 2.82GB / 8,035 frames / 8,550 objects [jpg]

Set 02 / Day / Downtown / 3.08GB / 7,866 frames / 11,493 objects [jpg]

Set 03 / Night / Campus / 2.40GB / 6,668 frames / 7,418 objects [jpg]

Set 04 / Night / Road / 2.88GB / 7,200 frames / 17,579 objects [jpg]

Set 05 / Night / Downtown / 1.01GB / 2,920 frames / 4,655 objects [jpg]

  • Test

Set 06 / Day / Campus / 4.78GB / 12,988 frames / 12,086 objects [jpg]

Set 07 / Day / Road / 3.04GB / 8,141 frames / 4,225 objects [jpg]

Set 08 / Day / Downtown / 3.50GB / 8,050 frames / 23,309 objects [jpg]

Set 09 / Night / Campus / 1.38GB / 3,500 frames / 3,577 objects [jpg]

Set 10 / Night / Road / 3.75GB / 8,902 frames / 4,987 objects [jpg]

Set 11 / Night / Downtown / 1.33GB / 3,560 frames / 6,655 objects [jpg]


2. 标注文件

[All, Annotation (48MB)]

标注使用自定义的 “视频边界框”(vbb)文件格式。

二、数据集预处理

1. vbb 标注文件转化为 XML 文件

完整代码:


参考资料

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐