首页 PaddleX 帖子详情
目标检测---01---目标检测数据格式说明
收藏
快速回复
PaddleX 文章入门 1020 3
目标检测---01---目标检测数据格式说明
收藏
快速回复
PaddleX 文章入门 1020 3

一、目标检测数据集目标区域的常见表达方式
目标检测一般需要标记出被检测目标的区域位置和类别。其中目标区域位置用一个矩形框来表示,一般用以下3种方式表达:

常见的目标检测数据集如Pascal VOC采用的[x1,y1,x2,y2] 表示物体的bounding box, COCO采用的[x1,y1,w,h] 表示物体的bounding box。
二、VOC格式数据说明
1、VOC数据目录结构
VOC数据目录结构如下(注意数据集中路径名、文件名尽量不要使用中文,避免中文编码问题导致出错),如果使用paddlex gui版本,请参加gui的目录命名要求。

2、XML文件说明
VOC数据是每个图像文件对应一个同名的xml文件,xml文件中标记物体框的坐标和类别等信息。例如图像xxx.jpg,肯定对应一个xxx.xml,图片对应的xml文件内包含对应图片的基本信息,比如文件名、来源、图像尺寸以及图像中包含的物体区域信息和类别信息等。
xml文件中包含以下字段:

其中物体类别的名称和bndbox是非常关键的属性。
3、各txt文件说明。

三、数据集划分的命令
使用paddlex命令即可将数据集随机划分成70%训练集,20%验证集和10%测试集:
paddlex --split_dataset --format VOC --dataset_dir dataset_path --val_value 0.2 --test_value 0.1
其中dataset_path为数据集的目录,下面包含有JPEGImages和Annotations目录

0
收藏
回复
全部评论(3)
时间顺序
余志良
#2 回复于2021-08

非常棒啊,老哥可否留下姓名和联系方式,我们paddleX的产品经理

0
回复
y
yuyangup
#3 回复于2021-08
非常棒啊,老哥可否留下姓名和联系方式,我们paddleX的产品经理

大佬啊,我在群里啊,我这就是把我炼丹的过程记录一下而已,都是api里的东西,后面写再慢慢写点心得吧。

 

话说这个编辑器真的是难用!写的真是想放弃啊,我都是在我的有道云笔记里写好再放上来的,结果格式都乱的一塌糊涂。

0
回复
李长安
#4 回复于2021-12

优秀

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户