目标检测---01---目标检测数据格式说明
收藏
一、目标检测数据集目标区域的常见表达方式
目标检测一般需要标记出被检测目标的区域位置和类别。其中目标区域位置用一个矩形框来表示,一般用以下3种方式表达:
常见的目标检测数据集如Pascal VOC采用的[x1,y1,x2,y2] 表示物体的bounding box, COCO采用的[x1,y1,w,h] 表示物体的bounding box。
二、VOC格式数据说明
1、VOC数据目录结构
VOC数据目录结构如下(注意数据集中路径名、文件名尽量不要使用中文,避免中文编码问题导致出错),如果使用paddlex gui版本,请参加gui的目录命名要求。
2、XML文件说明
VOC数据是每个图像文件对应一个同名的xml文件,xml文件中标记物体框的坐标和类别等信息。例如图像xxx.jpg,肯定对应一个xxx.xml,图片对应的xml文件内包含对应图片的基本信息,比如文件名、来源、图像尺寸以及图像中包含的物体区域信息和类别信息等。
xml文件中包含以下字段:
其中物体类别的名称和bndbox是非常关键的属性。
3、各txt文件说明。
三、数据集划分的命令
使用paddlex命令即可将数据集随机划分成70%训练集,20%验证集和10%测试集:
paddlex --split_dataset --format VOC --dataset_dir dataset_path --val_value 0.2 --test_value 0.1
其中dataset_path为数据集的目录,下面包含有JPEGImages和Annotations目录
0
收藏
请登录后评论
非常棒啊,老哥可否留下姓名和联系方式,我们paddleX的产品经理
大佬啊,我在群里啊,我这就是把我炼丹的过程记录一下而已,都是api里的东西,后面写再慢慢写点心得吧。
话说这个编辑器真的是难用!写的真是想放弃啊,我都是在我的有道云笔记里写好再放上来的,结果格式都乱的一塌糊涂。
优秀