目标检测时自定义数据集设置时出错

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

wanghrobin 发布于2021-05

从昆虫识别项目出来，把数据集换成自己拍摄的照片，107张照片。用labelme标注后上传AI studio作为自己的数据集。后来又把labels.txt等相关文件做好了放进数据集目录。跑到设置数据集时出错，最后一句不明白出错在哪。感觉是labels.txt和其他几个文件的问题。因为相同的数据集在paddleX上在本地跑完了没问题。

train_dataset = pdx.datasets.VOCDetection(
    data_dir='dataset_voc',
    file_list='dataset_voc/train_list.txt',
    label_list='dataset_voc/labels.txt',
    transforms=train_transforms,
    shuffle=True)
eval_dataset = pdx.datasets.VOCDetection(
    data_dir='dataset_voc',
    file_list='dataset_voc/val_list.txt',
    label_list='dataset_voc/labels.txt',
    transforms=eval_transforms)

出错信息：

2021-05-17 20:59:58 [INFO] Starting to read file list from dataset...

---------------------------------------------------------------------------ValueError Traceback (most recent call last) in
4 label_list='dataset_voc/labels.txt',
5 transforms=train_transforms,
----> 6 shuffle=True)
7 eval_dataset = pdx.datasets.VOCDetection(
8 data_dir='dataset_voc',
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddlex/cv/datasets/voc.py in __init__(self, data_dir, file_list, label_list, transforms, num_workers, buffer_size, parallel_method, shuffle)
102 .format(line))
103 img_file, xml_file = [osp.join(data_dir, x) \
--> 104 for x in line.strip().split()[:2]]
105 img_file = path_normalization(img_file)
106 xml_file = path_normalization(xml_file)
ValueError: not enough values to unpack (expected 2, got 0)

全部评论(4)

余志良

#2 回复于2021-05

你好，可以看一下数据里面有没有中文字符

wanghrobin

#3 回复于2021-05

余志良 #2

你好，可以看一下数据里面有没有中文字符

没有中文字符：

Labels.txt 是这样：

Buick
Chevy
Ford
GW
Honda
Lexus
Mazda
Toyota
Volvo
VW
Wuling

train_lists.txt是这样。正反斜杠都不行。

JPEGImages\0001.JPG Annotations\0001.xml
JPEGImages\0002.JPG Annotations\0002.xml
JPEGImages\0003.JPG Annotations\0003.xml
JPEGImages\0004.JPG Annotations\0004.xml
JPEGImages\0005.JPG Annotations\0005.xml
JPEGImages\0006.JPG Annotations\0006.xml

wanghrobin

#4 回复于2021-05

我想吐槽的是，用PaddleX GUI跑同一个数据集的项目，它会自己分割train、validate、test数据集，生成相应的*_lists.txt。我偷偷的把这个数据集连四个txt文件一起打个包，上传到AIstudio里跑训练程序就没有任何问题。txt文件单独传上去和原有图片和标注文件放一起也没问题。

所以怎么也搞不明白我自己凑的txt文件有何问题。

wanghrobin

#5 回复于2021-05

wanghrobin #3

没有中文字符： Labels.txt 是这样： Buick Chevy Ford GW Honda Lexus Mazda Toyota Volvo VW Wuling train_lists.txt是这样。正反斜杠都不行。 JPEGImages\0001.JPG Annotations\0001.xml JPEGImages\0002.JPG Annotations\0002.xml JPEGImages\0003.JPG Annotations\0003.xml JPEGImages\0004.JPG Annotations\0004.xml JPEGImages\0005.JPG Annotations\0005.xml JPEGImages\0006.JPG Annotations\0006.xml

展开

找到问题了。我自己分割出来训练集txt是用excel拼接字符串的。几个*_list.txt文件后面都跟着一长串的回车换行符。

全删掉就行了。