数据增广的道路是正义的吗?
189******30 发布于2020-02 浏览:3219 回复:2
0
收藏

昨天看了大佬的直播,介绍比赛经验(https://live.bilibili.com/21689802)。期间老师说,数据增广是调整、优化模型后每什么可做的时再做的事。这是什么意思?用GAN生成训练数据到底有没有意义?记得某金融大佬批评量化投资的一个观点就是:用系统输出的数据当输入是不合理的。那么蒙特卡洛出来的符合分布特征的数据到底能不能用于训练模型?

收藏
点赞
0
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#3189******30回复于2020-02
#2 星光ld1回复
我个人认为数据增强是为了提高泛化的一种手段,收集的数据成本很高,通常是有限的,难以覆盖所有的模式,比如可能都是白天采集的,都是某个视角拍的,会有一定的局限性但是测试集往往不会是那么干净的分布,通过增强引入了更多的模式进去,泛化性会更好从而产生更好的测试性能
展开

谢谢,现在我也这么认为了。后来又看了些文章,拓宽了思路。

0
#2星光ld1回复于2020-02

我个人认为数据增强是为了提高泛化的一种手段,收集的数据成本很高,通常是有限的,难以覆盖所有的模式,比如可能都是白天采集的,都是某个视角拍的,会有一定的局限性但是测试集往往不会是那么干净的分布,通过增强引入了更多的模式进去,泛化性会更好从而产生更好的测试性能

0
TOP
切换版块