怎么标注自己的数据集比较好?求分享经验
收藏
想问问大佬们都是都是怎么标注数据集的。
我用labelme标注一些图时,因为图片中的标记目标有重叠这时候我怎么标记比较好(比如两只狗,一只被另外一只挡住了部分)
还有使用poligons是不是会比rectangle 好点?
1
收藏
请登录后评论
离的近的是目标检测的难点。还是应该标注成两只。
被遮挡的也要标注整体,而不是只标注露出的部分。这样才能增强模型检测被遮挡,或离得近的目标的能力
不知道有没有用多边形标注目标检测数据集的。大部分是矩形。但有带角度的
用过,圣诞节那个就是不规则
我一开始使用的矩形框标注,挡住的部分也标记了。但是跑出来的模型过拟合 可能两只狗 有重叠部分,出来的box有三个......把整体也识别成了一只。现在再试多点的不规则标注。
我觉得标注现在已经是一个非常专业的工作了,专业公司有专业的标准。虽说用labelimg大家都能标,但是和专业要求一定是有差距的。
被遮挡的我也是有标的。标注数量上去了重叠也一样有些不一样的。比如猫和狗的耳朵和身体轮廓比例。
涨姿势了!
后来搜搜,真是有各种标注方法。有些还是从文本检测那儿来的。
还没深入了解检测算法,感觉与矩形框算法的不同主要在roi计算和候选框的回归上吧