整个搜索空间太大,只能人工设计。那么数据、经验、算力足够多了的情况下,可以用强化学习的方法搜索模型空间么?
就像用原始gan生成的数据训练分类模型一样
我觉得人肉标注是唯一正途~~
我jio得机器学习的其实是人的认知能力
今天我看了下实习僧,有专门做语言标注的,只要英语专业学生
用ai标注训练ai的数据集,这“正义”么~~
模型是要训练的呀,只能说算法设计得好,给少量数据就能出效果
也有可能有些是直接有这个类别的,比如基于coco有预训练模型了,你给些汽车的图其实不用训练就有了。比如PPOCRLabel里,如果是文档字体识别效果还可以的。
分割可是像素级标注啊……成本是检测的5倍不止
确实,分割标注费眼睛
比如检测任务里,标注的数据集就是标注公司模型检测的结果吧。直接买那个标注模型用来检测不就好了~~
当然,我这是在请教。不然就没有标注公司了
有这个必要么?有这个必要么~~
既然标注模型能做数据集的分割任务了,还有必要再标注数据集么?
没太理解的主要是:既然标注公司能够用模型标注数据,这就说明标注公司已经有了完成相应任务的模型了。为什么还要去标注数据,然后再在这些标注数据上再训练一个模型?
比如,标注公司有一个人脸检测模型用于标注图片中的人脸,那么用这个模型标注的人脸数据集去训练另一个模型有意义么?
还是说,这些数据集只是加入其他数据集,用来训练更为丰富的模型
要是这样的话有没有类似模型蒸馏的方法直接让模型教模型,不用再用数据集打个接力了~
感觉分割的标注也最有提升空间,有的区域全框起来,像素刷一下就能填满了
这个真是专业技能了……不是还有大厂以算法工程师名义招人实习结果干的是标注嘛/狗头
标注模型出来的是初稿,还是要精调的,所以所谓的降低标注成本,就是精调时间vs初调时间或者vs从头开始时间算的吧
因为初始的模型肯定没那么完美呀
就像用原始gan生成的数据训练分类模型一样
我觉得人肉标注是唯一正途~~
我jio得机器学习的其实是人的认知能力
今天我看了下实习僧,有专门做语言标注的,只要英语专业学生
用ai标注训练ai的数据集,这“正义”么~~
模型是要训练的呀,只能说算法设计得好,给少量数据就能出效果
也有可能有些是直接有这个类别的,比如基于coco有预训练模型了,你给些汽车的图其实不用训练就有了。比如PPOCRLabel里,如果是文档字体识别效果还可以的。
分割可是像素级标注啊……成本是检测的5倍不止
确实,分割标注费眼睛
比如检测任务里,标注的数据集就是标注公司模型检测的结果吧。直接买那个标注模型用来检测不就好了~~
当然,我这是在请教。不然就没有标注公司了
有这个必要么?有这个必要么~~
既然标注模型能做数据集的分割任务了,还有必要再标注数据集么?
没太理解的主要是:既然标注公司能够用模型标注数据,这就说明标注公司已经有了完成相应任务的模型了。为什么还要去标注数据,然后再在这些标注数据上再训练一个模型?
比如,标注公司有一个人脸检测模型用于标注图片中的人脸,那么用这个模型标注的人脸数据集去训练另一个模型有意义么?
还是说,这些数据集只是加入其他数据集,用来训练更为丰富的模型
要是这样的话有没有类似模型蒸馏的方法直接让模型教模型,不用再用数据集打个接力了~
感觉分割的标注也最有提升空间,有的区域全框起来,像素刷一下就能填满了
这个真是专业技能了……不是还有大厂以算法工程师名义招人实习结果干的是标注嘛/狗头
标注模型出来的是初稿,还是要精调的,所以所谓的降低标注成本,就是精调时间vs初调时间或者vs从头开始时间算的吧
因为初始的模型肯定没那么完美呀