怎么标注自己的数据集比较好？求分享经验

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

搬运工发布于2020-12

想问问大佬们都是都是怎么标注数据集的。

我用labelme标注一些图时，因为图片中的标记目标有重叠这时候我怎么标记比较好（比如两只狗，一只被另外一只挡住了部分）

还有使用poligons是不是会比rectangle 好点？

全部评论(9)

AIStudio810258

#2 回复于2020-12

离的近的是目标检测的难点。还是应该标注成两只。

AIStudio810258

#3 回复于2020-12

被遮挡的也要标注整体，而不是只标注露出的部分。这样才能增强模型检测被遮挡，或离得近的目标的能力

AIStudio810258

#4 回复于2020-12

不知道有没有用多边形标注目标检测数据集的。大部分是矩形。但有带角度的

AIStudio810259

#5 回复于2020-12

AIStudio810258 #4

不知道有没有用多边形标注目标检测数据集的。大部分是矩形。但有带角度的

用过，圣诞节那个就是不规则

搬运工

#6 回复于2020-12

AIStudio810258 #3

被遮挡的也要标注整体，而不是只标注露出的部分。这样才能增强模型检测被遮挡，或离得近的目标的能力

我一开始使用的矩形框标注，挡住的部分也标记了。但是跑出来的模型过拟合可能两只狗有重叠部分,出来的box有三个......把整体也识别成了一只。现在再试多点的不规则标注。

AIStudio810260

#7 回复于2020-12

我觉得标注现在已经是一个非常专业的工作了，专业公司有专业的标准。虽说用labelimg大家都能标，但是和专业要求一定是有差距的。

周小鱼whoyou

#8 回复于2020-12

被遮挡的我也是有标的。标注数量上去了重叠也一样有些不一样的。比如猫和狗的耳朵和身体轮廓比例。

AIStudio810258

#9 回复于2020-12

AIStudio810259 #5

用过，圣诞节那个就是不规则

涨姿势了！

后来搜搜，真是有各种标注方法。有些还是从文本检测那儿来的。

AIStudio810258

#10 回复于2020-12

AIStudio810259 #5

用过，圣诞节那个就是不规则

还没深入了解检测算法，感觉与矩形框算法的不同主要在roi计算和候选框的回归上吧

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~