【答疑帖】数据集似乎有缺失?
收藏
快速回复
【答疑帖】数据集似乎有缺失?
收藏
快速回复

我发现这个训练集的标注似乎和原图对不上。

这是有标注的训练图片的标注,一般应该是这样子的

然后这样的有500类,每个类放到一个文件夹里,大致是这样,文件夹里面的都是上面的黑白图像,也就是标注,原图没有

这以上都很正常,问题出现在另一个百度网盘的链接下载下来的一个五十多G的压缩包上,解压后是历年的比赛数据,在里面找这些图片对应的原图时有一些类别找不到。如下

图中是解压后的训练集原始图片,已经按名称进行了排序,可以对比之前的标注类别的图片,第一个类n01443537有对应的类别文件夹,而第二类n01491361却找不到。

因此实际有标注的类别数应该会小于500。不过加压后的文件夹其实还有很多,上面的图只是2013年的数据,可能在其他年份里会有这些类别的原图?我个人觉得不会,因为其他年份的数据文件夹里面就直接全是图片,都没有像这个一样分成每个类别,所以应该是没有的。

希望官方可以解答一下,多谢

0
收藏
回复
全部评论(1)
时间顺序
比赛官方账号
#2 回复于2021-07

请查看最新训练数据集下载链接:

https://aistudio.baidu.com/aistudio/datasetdetail/95702

 

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户