首页 炼丹房 帖子详情
目标检测时自定义数据集设置时出错
收藏
快速回复
炼丹房 问答新手上路 1058 4
目标检测时自定义数据集设置时出错
收藏
快速回复
炼丹房 问答新手上路 1058 4

从昆虫识别项目出来,把数据集换成自己拍摄的照片,107张照片。用labelme标注后上传AI studio作为自己的数据集。后来又把labels.txt等相关文件做好了放进数据集目录。跑到设置数据集时出错,最后一句不明白出错在哪。感觉是labels.txt和其他几个文件的问题。因为相同的数据集在paddleX上在本地跑完了没问题。

train_dataset = pdx.datasets.VOCDetection(
    data_dir='dataset_voc',
    file_list='dataset_voc/train_list.txt',
    label_list='dataset_voc/labels.txt',
    transforms=train_transforms,
    shuffle=True)
eval_dataset = pdx.datasets.VOCDetection(
    data_dir='dataset_voc',
    file_list='dataset_voc/val_list.txt',
    label_list='dataset_voc/labels.txt',
    transforms=eval_transforms)

出错信息:

2021-05-17 20:59:58 [INFO] Starting to read file list from dataset...

---------------------------------------------------------------------------ValueError Traceback (most recent call last) in
4 label_list='dataset_voc/labels.txt',
5 transforms=train_transforms,
----> 6 shuffle=True)
7 eval_dataset = pdx.datasets.VOCDetection(
8 data_dir='dataset_voc',
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddlex/cv/datasets/voc.py in __init__(self, data_dir, file_list, label_list, transforms, num_workers, buffer_size, parallel_method, shuffle)
102 .format(line))
103 img_file, xml_file = [osp.join(data_dir, x) \
--> 104 for x in line.strip().split()[:2]]
105 img_file = path_normalization(img_file)
106 xml_file = path_normalization(xml_file)
ValueError: not enough values to unpack (expected 2, got 0)

0
收藏
回复
全部评论(4)
时间顺序
余志良
#2 回复于2021-05

你好,可以看一下数据里面有没有中文字符

 

0
回复
wanghrobin
#3 回复于2021-05
你好,可以看一下数据里面有没有中文字符  

没有中文字符:

Labels.txt 是这样:

Buick
Chevy
Ford
GW
Honda
Lexus
Mazda
Toyota
Volvo
VW
Wuling

train_lists.txt是这样。 正反斜杠都不行。

JPEGImages\0001.JPG Annotations\0001.xml
JPEGImages\0002.JPG Annotations\0002.xml
JPEGImages\0003.JPG Annotations\0003.xml
JPEGImages\0004.JPG Annotations\0004.xml
JPEGImages\0005.JPG Annotations\0005.xml
JPEGImages\0006.JPG Annotations\0006.xml

0
回复
wanghrobin
#4 回复于2021-05

我想吐槽的是,用PaddleX GUI跑同一个数据集的项目,它会自己分割train、validate、test数据集,生成相应的*_lists.txt。 我偷偷的把这个数据集连四个txt文件一起打个包,上传到AIstudio里跑训练程序就没有任何问题。txt文件单独传上去和原有图片和标注文件放一起也没问题。

所以怎么也搞不明白我自己凑的txt文件有何问题。

 

0
回复
wanghrobin
#5 回复于2021-05
没有中文字符: Labels.txt 是这样: Buick Chevy Ford GW Honda Lexus Mazda Toyota Volvo VW Wuling train_lists.txt是这样。 正反斜杠都不行。 JPEGImages\0001.JPG Annotations\0001.xml JPEGImages\0002.JPG Annotations\0002.xml JPEGImages\0003.JPG Annotations\0003.xml JPEGImages\0004.JPG Annotations\0004.xml JPEGImages\0005.JPG Annotations\0005.xml JPEGImages\0006.JPG Annotations\0006.xml
展开

找到问题了。我自己分割出来训练集txt是用excel拼接字符串的。几个*_list.txt文件后面都跟着一长串的回车换行符。

全删掉就行了。

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户