在使用labelimg标注图片时,lable提供了两种标注信息保存格式,一种是VOC,另一种则是Yolo。

1 VOC数据格式

在labelimage中,对一个图片完成标注之后,如果默认选择的是PascalVOC格式

目标检测 – VOC数据格式和Yolo数据格式-StubbornHuang Blog

则会将标注信息保存为以下的xml文件,主要的信息包括:

  • filename:图片名称
  • width:图片的宽度
  • height:图片的高度
  • object/name:目标检测名称
  • object/bndbox:xmin、ymin、xmax、ymax分别对应检测框的左上角的坐标(xmin,ymin)和右下角的坐标(xmax,ymax)

示例的标注内容如下:

<annotation>
    <folder>windows_v1.8.0</folder>
    <filename>00a81e13-e75a-44cf-ab3b-9e4b59c3a893.jpg</filename>
    <path>F:/Software/labelImg/windows_v1.8.0/00a81e13-e75a-44cf-ab3b-9e4b59c3a893.jpg</path>
    <source>
        <database>Unknown</database>
    </source>
    <size>
        <width>512</width>
        <height>682</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>hand</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>124</xmin>
            <ymin>213</ymin>
            <xmax>299</xmax>
            <ymax>366</ymax>
        </bndbox>
    </object>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>18</xmin>
            <ymin>78</ymin>
            <xmax>502</xmax>
            <ymax>636</ymax>
        </bndbox>
    </object>
</annotation>

2 Yolo数据格式

如果在labelimg选择标签数据格式为yolo

目标检测 – VOC数据格式和Yolo数据格式-StubbornHuang Blog

则会将标注信息保存为txt文件,示例的标注信息如下:

1 0.414062 0.428886 0.343750 0.224340

上面的一行信息代表标注的一个目标,数据按以下顺序排列

class_id    x_center         y_center        width         height
目标标签的id 标注框的中心坐标x 标注框的中心坐标y 标注框相对的宽 标注框相对的高