关于自增训练数据集减小误判概率的问题
收藏
最近在做一个安全帽识别的项目,正确的识别只有两种状态,一种是带了安全帽,一种是没戴安全帽。但是现在出现一种检测误差就是没有带在头上的安全帽也会在小概率上被误测出来。
上图为检测效果,此图并未出现误测现象
我们想通过增添静置安全帽的数据集来学习,增强模型对于这方面的学习能力。类似下图所示
但是存在一个问题就是:如果我们为这种类型的图片标注了xml文件,但是xml中没有Object,只有Size这些图片的信息,这样的学习能够增强模型对于这种静置安全帽的学习能力吗?就是能不能借此来减小误判的概率?
0
收藏
请登录后评论
因为一般的训练图片的xml里面都是带有Object内容的,但是我们旨在让他学习不去把这个当作安全帽处理,因为我们定义的安全帽是戴在人头上的安全帽
我觉得可以参考那个AI识虫的项目,一路用paddledetection做一个目标检测,一路虫子抠出来单独做一个分类模型,预测的时候再把目标检测算出的框抠出来让分类模型矫正。
我觉得加入不标注的样本意义不大。将单独放置的安全帽最为一个新的类别让模型识别是更好的方法。
就是说训练模型识别“带着安全帽的”、“不带安全帽的”和“没带在头上的安全帽”三种类别。然后预测时把“没带在头上的安全帽”剔除掉就行了。
还要注意图像増广的处理。某些方法(比如上下翻转)可能还会降低识别准确率。
如果重新标注所有数据太花钱的话。还有一个办法是目标检测完成后,后面再接一个二分类模型,把检测“有安全帽目标”的结果再进行一个二分类。
分类模型的训练数据都不用标注框的,成本很低。
就是预测会慢了。
总的来说还是新加入“静置安全帽”的新样本更合理。
【下面是我写的一些小贴,有空可以fork玩玩(项目列表)】
训练数据太少?过拟合?一文带你领略“数据增长魔法”(上) (https://aistudio.baidu.com/aistudio/projectdetail/408059)
训练数据太少?过拟合?一文带你领略“数据增长魔法”(下) (https://aistudio.baidu.com/aistudio/projectdetail/422256)
一文帮你理解用Paddle训练模型的原理1-手写回归模型 (https://aistudio.baidu.com/aistudio/projectdetail/367090)
一文帮你理解用Paddle训练模型的原理2-权值可视化(VisualDL) (https://aistudio.baidu.com/aistudio/projectdetail/386954)
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76563
谢谢啦