如果我有一张橘子和一张苹果的图片,我能够使用GAN来生成对应的图像(很多张橘子和苹果),从而实现数据集的拓展吗?
如果不行的话,那如果我有100张橘子和苹果的图像,能够实现数据集的拓展吗?
另外我要拿这些生成的数据去训练神经网络从而来分辨橘子和苹果,我能够实现吗?
之前看到一个帖子,用GAN来生成图像来扩充数据集应该是可行的
GAN接触比较少,效果不清楚怎么样。100张图像如果不能完全表示真实数据的分布,用GAN根据给定某类型的分布来生成分布后,也很难去逼近真实分布吧。。
数据集太少可以试一试迁移加上平移裁剪翻转扰动这些数据增强
只有100张图片的话可以在数据增强方面多做点
有用单张图片做GAN的。大意就是每次用图片的不同部分学习其像素的概率分布。单张无论是做数据增强还是分类都是挑战啊
100张的话,分类我觉得都得用预训练模型finetune
直接训练我觉得泛化能力堪忧
100张图片做GAN,我觉得大概率会模式崩溃。
GAN直接用于做数据增强的一个悖论就是,如果生成器能很好的拟合概率分布,那分类器应该也能。
如果100张图片分类器都分不好,GAN就更难拟合数据分布了。
如果有足够多的数据训练GAN,其生成的图片当然能用来训练分类网络。但何必多此一举呢?用原来的数据就能训练分类网络啊。而且我在MNIST手写字符集上试过,也没有提升分类效果。
以上只是个人不成熟的看法。我也看到过有在医疗领域用GAN做CT片数据增强的。所以随着掌握的信息越来越多,也许会找到好方法
现在用GAN做数据增强的也有一些特定场景的应用。比如行人重识别应用。用GAN,给图片中的行人生成不同衣装,生成不同时间等背景信息,生成不同摄像头光学特性的图片等
也有用在情绪识别应用中的。用那个名人人脸数据集生成各种表情,以丰富训练数据的。
还有,我讨论相关问题时,一位同学推荐看的水下目标识别的应用。那个应用里用GAN改善的水下照片的清晰度,也可视为一种数据增强吧。
总之,现阶段,我对GAN做数据增强的理解是:得认为的设计给数据做增强的域。解释下就是。原来有张穿白衣的行人,白天行走在街道上的照片。然后用GAN生成此行人穿各种衣装,在各种时空背景下的其他图片来补充数据集,才真正能够增强分类网络的泛化能力。这个道理也很显而易见。
人为设计给数据做增强的域
谢谢大家的回复,我本来是想实现拓展数据集然后再去训练分类器的,这样看来似乎不太可行。
这样的话就要考虑考虑别的方式方法了。
这段时间看了好多GAN的各种拓展,还没实操过,是想完成一篇课程的论文,各位大佬有推荐的选题吗?
不适合直接用,还是能用的。
可以看看这篇综述扩下思路
https://zhuanlan.zhihu.com/p/44654536
之前看到一个帖子,用GAN来生成图像来扩充数据集应该是可行的
GAN接触比较少,效果不清楚怎么样。100张图像如果不能完全表示真实数据的分布,用GAN根据给定某类型的分布来生成分布后,也很难去逼近真实分布吧。。
数据集太少可以试一试迁移加上平移裁剪翻转扰动这些数据增强
只有100张图片的话可以在数据增强方面多做点
有用单张图片做GAN的。大意就是每次用图片的不同部分学习其像素的概率分布。单张无论是做数据增强还是分类都是挑战啊
100张的话,分类我觉得都得用预训练模型finetune
直接训练我觉得泛化能力堪忧
100张图片做GAN,我觉得大概率会模式崩溃。
GAN直接用于做数据增强的一个悖论就是,如果生成器能很好的拟合概率分布,那分类器应该也能。
如果100张图片分类器都分不好,GAN就更难拟合数据分布了。
如果有足够多的数据训练GAN,其生成的图片当然能用来训练分类网络。但何必多此一举呢?用原来的数据就能训练分类网络啊。而且我在MNIST手写字符集上试过,也没有提升分类效果。
以上只是个人不成熟的看法。我也看到过有在医疗领域用GAN做CT片数据增强的。所以随着掌握的信息越来越多,也许会找到好方法
现在用GAN做数据增强的也有一些特定场景的应用。比如行人重识别应用。用GAN,给图片中的行人生成不同衣装,生成不同时间等背景信息,生成不同摄像头光学特性的图片等
也有用在情绪识别应用中的。用那个名人人脸数据集生成各种表情,以丰富训练数据的。
还有,我讨论相关问题时,一位同学推荐看的水下目标识别的应用。那个应用里用GAN改善的水下照片的清晰度,也可视为一种数据增强吧。
总之,现阶段,我对GAN做数据增强的理解是:得认为的设计给数据做增强的域。解释下就是。原来有张穿白衣的行人,白天行走在街道上的照片。然后用GAN生成此行人穿各种衣装,在各种时空背景下的其他图片来补充数据集,才真正能够增强分类网络的泛化能力。这个道理也很显而易见。
人为设计给数据做增强的域
谢谢大家的回复,我本来是想实现拓展数据集然后再去训练分类器的,这样看来似乎不太可行。
这样的话就要考虑考虑别的方式方法了。
这段时间看了好多GAN的各种拓展,还没实操过,是想完成一篇课程的论文,各位大佬有推荐的选题吗?
不适合直接用,还是能用的。
可以看看这篇综述扩下思路
https://zhuanlan.zhihu.com/p/44654536