【答疑帖】数据集似乎有缺失?
收藏
我发现这个训练集的标注似乎和原图对不上。
这是有标注的训练图片的标注,一般应该是这样子的
然后这样的有500类,每个类放到一个文件夹里,大致是这样,文件夹里面的都是上面的黑白图像,也就是标注,原图没有
这以上都很正常,问题出现在另一个百度网盘的链接下载下来的一个五十多G的压缩包上,解压后是历年的比赛数据,在里面找这些图片对应的原图时有一些类别找不到。如下
图中是解压后的训练集原始图片,已经按名称进行了排序,可以对比之前的标注类别的图片,第一个类n01443537有对应的类别文件夹,而第二类n01491361却找不到。
因此实际有标注的类别数应该会小于500。不过加压后的文件夹其实还有很多,上面的图只是2013年的数据,可能在其他年份里会有这些类别的原图?我个人觉得不会,因为其他年份的数据文件夹里面就直接全是图片,都没有像这个一样分成每个类别,所以应该是没有的。
希望官方可以解答一下,多谢
0
收藏
请登录后评论
请查看最新训练数据集下载链接:
https://aistudio.baidu.com/aistudio/datasetdetail/95702