Pascal VOC challenge是一个非常流行的数据集,用于构建和评估用于图像分类、对象检测和分割的算法。
这个挑战的目标是在现实场景中从大量的可视对象类中识别对象(即不是预先分割的对象)。有20个对象类:
有两个主要任务:
两个可尝试的额外任务:
全称
The PASCAL Visual Object Classes Challenge 2007 (VOC2007)
这个文件夹放置的是对每一张图片的标注,为XML文件。
JPEGImages文件夹中的每张图片都在此有对应的XML文件,文件命名格式为:<图片编号.xml>。
我们以000001.xml为例进行说明。
000001.jpg:
000001.xml:
VOC 2007数据集中图片的bounding box的四个坐标分别为左上角和右下角的x,y坐标 ( x m i n , y m i n , x m a x , y m a x ) (x_{min}, y_{min}, x_{max}, y_{max}) (xmin,ymin,xmax,ymax),且图片是1-base的,即图片左上角的点坐标为(1, 1)。
官方文档:The PASCAL Visual Object Classes Challenge
2007 (VOC2007) Development Kit,page:20
注释:照我们正常的理解来说,bndbox中表示的应当是矩形框的左下角和右上角坐标,但实际上这里使用的是以左上角为原点的屏幕坐标系,图示如下:
参考:屏幕坐标系,世界坐标系
ImageSets存放的是每一种类型的challenge对应的图像数据。
Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)。
Main下存放的是图像物体识别的数据,总共分为20类。
Segmentation下存放的是可用于分割的数据。
这个文件夹主要放置数据的原始图片,共9963张图片,文件命名格式为:<图片编号.jpg>。
按类别进行图像分割,同一类别的物体会被标注为相同颜色。
按对象进行图像分割,即使是同一类别的物体会被标注为不同的颜色。
计算机视觉标准数据集整理—PASCAL VOC数据集
VOC2007数据集解析
Pascal VOC Dataset Mirror
数据集:Pascal VOC 2007数据集分析
手机扫一扫
移动阅读更方便
你可能感兴趣的文章