昨天看了大佬的直播,介绍比赛经验(https://live.bilibili.com/21689802)。期间老师说,数据增广是调整、优化模型后每什么可做的时再做的事。这是什么意思?用GAN生成训练数据到底有没有意义?记得某金融大佬批评量化投资的一个观点就是:用系统输出的数据当输入是不合理的。那么蒙特卡洛出来的符合分布特征的数据到底能不能用于训练模型?
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
谢谢,现在我也这么认为了。后来又看了些文章,拓宽了思路。
我个人认为数据增强是为了提高泛化的一种手段,收集的数据成本很高,通常是有限的,难以覆盖所有的模式,比如可能都是白天采集的,都是某个视角拍的,会有一定的局限性但是测试集往往不会是那么干净的分布,通过增强引入了更多的模式进去,泛化性会更好从而产生更好的测试性能