DataSet定义里加数据增强合适吗?
感觉增强后再划分训练集、验证集是不是不妥?
一般就是在Dateset的__gettime__()函数里做数据增强。增强后再划分训练和验证集不妥,这样会导致验证集中有一部分是来自训练集的数据增强,而这部分更容易识别正确,会导致验证集精度偏高。所以还是先划分再做数据增强。
嘿嘿嘿,额也是这么想的。划分了再增强,增强的搞到训练集里去。
我觉得单独拿出来好一点,各个模块分工具体。DataSet里面定义看起来代码更加“模块化”,实际调试起来会比较麻烦
咦?我又可以发新贴了。
好家伙,直呼内行
合适着呢,官方套件都这么用的~~
就是一些复杂点的就得分散代码了,比如mixup这样的
这个可以在增强函数里设个开关,判断train与否
不亦乐乎~
欢迎新内行~
独乐乐不如众乐乐
原来是这样,学习了!
原来新贴是这么来的……
众人拾柴欢乐多~
GitHub上的代码结构太大了,动不动就跳转函数
不应该是 __getitem__() 吗
哈哈哈,不小心写错了
就你懂得多
对呀对呀
这样呀
一般就是在Dateset的__gettime__()函数里做数据增强。增强后再划分训练和验证集不妥,这样会导致验证集中有一部分是来自训练集的数据增强,而这部分更容易识别正确,会导致验证集精度偏高。所以还是先划分再做数据增强。
嘿嘿嘿,额也是这么想的。划分了再增强,增强的搞到训练集里去。
我觉得单独拿出来好一点,各个模块分工具体。DataSet里面定义看起来代码更加“模块化”,实际调试起来会比较麻烦
咦?我又可以发新贴了。
好家伙,直呼内行
合适着呢,官方套件都这么用的~~
就是一些复杂点的就得分散代码了,比如mixup这样的
这个可以在增强函数里设个开关,判断train与否
不亦乐乎~
欢迎新内行~
独乐乐不如众乐乐
原来是这样,学习了!
原来新贴是这么来的……
众人拾柴欢乐多~
GitHub上的代码结构太大了,动不动就跳转函数
不应该是 __getitem__() 吗
哈哈哈,不小心写错了
就你懂得多
对呀对呀
这样呀