最近在做一个垃圾分类的项目,就是训练集上的所有xml文件都只有一个属性就是这个照片对应的是干垃圾,湿垃圾,还是有害垃圾,并没有给出垃圾的xyxy坐标。
但是这种情况下,似乎yolo类模型就不太适用于这种模式下的检测了,反而有点像MNIST数字识别分类的感觉了。想问下大佬们就是,这类型的识别一般常见的有哪些模型呢(一张图片,只知道一个结果,现在用的是resnet101来直接提取特征),还有就是如果想做一张图片多个垃圾种类的分类的话,是不是这样的xml训练数据就不能满足这样的项目需求了。
感觉就是如果基于这样的数据集,如果想要做出更好的效果的话,就可以试着画出anchor,但是怎么得到训练集的垃圾坐标的xyxy也有点难度,想过用图像语义分割把目标的轮廓搞出来,然后用边界值思想去get它的xyxy,但是没试过,不知道可行性咋样
anchor-free?
如果用分类模型做,一张图片只能分一类。
用检测模型做,就得标注数据。
标注部分数据的话,也有半监督方法
我对anchor-free的理解也挺模糊的,请问就是指训练不需要框出目标对象的模型嘛?
大佬,你说的半监督方法是啥呢,可以稍微提点下嘛
读过帖子上的介绍,一些算法可以不用标注全部数据。
或者是在原有标注好的数据集基础上,通过添加大量未标注数据能够提升模型精度。本质和标注部分数据是一回事
大略了解了一下思路就是:模型找到了一种衡量未标注数据的方法改进了损失函数。
可以百度下,半监督分类,半监督目标检测之类关键字
一个图片对应一个类别结果,你做的这个项目确实就是分类任务了,而yolo是用在目标检测任务上,不适合在这里用。
至于分类模型,其实分类模型大部分就是目标检测的主干网络,你可以去查查哪些主干网络性能不错,像resnet的一些变种网络ResNeXt,还有其他类型的Stacked Hourglass Networks等等,这里面实在太多,我也说不好。
你的数据格式一般只能用来做分类任务,一张图片做多种垃圾检测的话,是多标签分类任务(一张图片输出多种垃圾类别),你可以再搜搜这一块。
如果你还想要位置信息,要么自己标注,要么就只能尝试前面人说的半监督那些方法了,效果我不知道,但是难度会高一些。
好的,谢谢啦
嗯嗯,好的,我自己再去了解尝试下
我感觉这是分类?
anchor-free对数据集的要求和yolo是一样的啊?
其实这是一个比较尴尬的点,像opencv这种,其实有时候轮廓已经提取的不错了
但是只是提取轮廓,却不知道“它”是什么
图像分类大概知道“它是什么”,但是要变成检测任务还要付出不小的标注成本
还有一种做法可以低成本改成检测任务,但目前还比较复杂,就是手动标注少量的图片,然后给目标检测模型训练,自动标剩下的再来调整
感觉就是如果基于这样的数据集,如果想要做出更好的效果的话,就可以试着画出anchor,但是怎么得到训练集的垃圾坐标的xyxy也有点难度,想过用图像语义分割把目标的轮廓搞出来,然后用边界值思想去get它的xyxy,但是没试过,不知道可行性咋样
anchor-free?
如果用分类模型做,一张图片只能分一类。
用检测模型做,就得标注数据。
标注部分数据的话,也有半监督方法
我对anchor-free的理解也挺模糊的,请问就是指训练不需要框出目标对象的模型嘛?
大佬,你说的半监督方法是啥呢,可以稍微提点下嘛
读过帖子上的介绍,一些算法可以不用标注全部数据。
或者是在原有标注好的数据集基础上,通过添加大量未标注数据能够提升模型精度。本质和标注部分数据是一回事
大略了解了一下思路就是:模型找到了一种衡量未标注数据的方法改进了损失函数。
可以百度下,半监督分类,半监督目标检测之类关键字
一个图片对应一个类别结果,你做的这个项目确实就是分类任务了,而yolo是用在目标检测任务上,不适合在这里用。
至于分类模型,其实分类模型大部分就是目标检测的主干网络,你可以去查查哪些主干网络性能不错,像resnet的一些变种网络ResNeXt,还有其他类型的Stacked Hourglass Networks等等,这里面实在太多,我也说不好。
你的数据格式一般只能用来做分类任务,一张图片做多种垃圾检测的话,是多标签分类任务(一张图片输出多种垃圾类别),你可以再搜搜这一块。
如果你还想要位置信息,要么自己标注,要么就只能尝试前面人说的半监督那些方法了,效果我不知道,但是难度会高一些。
好的,谢谢啦
嗯嗯,好的,我自己再去了解尝试下
我感觉这是分类?
anchor-free对数据集的要求和yolo是一样的啊?
其实这是一个比较尴尬的点,像opencv这种,其实有时候轮廓已经提取的不错了
但是只是提取轮廓,却不知道“它”是什么
图像分类大概知道“它是什么”,但是要变成检测任务还要付出不小的标注成本
还有一种做法可以低成本改成检测任务,但目前还比较复杂,就是手动标注少量的图片,然后给目标检测模型训练,自动标剩下的再来调整