目标检测---01---目标检测数据格式说明

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

y yuyangup 发布于2021-07

一、目标检测数据集目标区域的常见表达方式
目标检测一般需要标记出被检测目标的区域位置和类别。其中目标区域位置用一个矩形框来表示，一般用以下3种方式表达：

常见的目标检测数据集如Pascal VOC采用的[x1,y1,x2,y2] 表示物体的bounding box, COCO采用的[x1,y1,w,h] 表示物体的bounding box。
二、VOC格式数据说明
1、VOC数据目录结构
VOC数据目录结构如下（注意数据集中路径名、文件名尽量不要使用中文，避免中文编码问题导致出错）,如果使用paddlex gui版本，请参加gui的目录命名要求。

2、XML文件说明
VOC数据是每个图像文件对应一个同名的xml文件，xml文件中标记物体框的坐标和类别等信息。例如图像xxx.jpg,肯定对应一个xxx.xml,图片对应的xml文件内包含对应图片的基本信息，比如文件名、来源、图像尺寸以及图像中包含的物体区域信息和类别信息等。
xml文件中包含以下字段：

其中物体类别的名称和bndbox是非常关键的属性。
3、各txt文件说明。

三、数据集划分的命令
使用paddlex命令即可将数据集随机划分成70%训练集，20%验证集和10%测试集:
paddlex --split_dataset --format VOC --dataset_dir dataset_path --val_value 0.2 --test_value 0.1
其中dataset_path为数据集的目录，下面包含有JPEGImages和Annotations目录

0

收藏

回复

全部评论(3)

余志良

#2 回复于2021-08

非常棒啊，老哥可否留下姓名和联系方式，我们paddleX的产品经理

0

回复

y

yuyangup

#3 回复于2021-08

余志良 #2

非常棒啊，老哥可否留下姓名和联系方式，我们paddleX的产品经理

大佬啊，我在群里啊，我这就是把我炼丹的过程记录一下而已，都是api里的东西，后面写再慢慢写点心得吧。

话说这个编辑器真的是难用！写的真是想放弃啊，我都是在我的有道云笔记里写好再放上来的，结果格式都乱的一塌糊涂。

0

回复

李长安

#4 回复于2021-12

优秀

0

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~