首页 Paddle框架 帖子详情
DataSet定义里加数据增强合适吗?
收藏
快速回复
Paddle框架 问答深度学习 3234 42
DataSet定义里加数据增强合适吗?
收藏
快速回复
Paddle框架 问答深度学习 3234 42

DataSet定义里加数据增强合适吗?

感觉增强后再划分训练集、验证集是不是不妥?

0
收藏
回复
全部评论(42)
时间顺序
thinc
#22 回复于2020-12
对呀对呀

这个在官方给的API教程里面有

0
回复
thinc
#23 回复于2020-12
这样呀

七哥水贴有一手了

0
回复
AIStudio810258
#24 回复于2021-01
thinc #16
GitHub上的代码结构太大了,动不动就跳转函数

都是模块儿化的,分而治之~~

0
回复
AIStudio810258
#25 回复于2021-01
thinc #17
不应该是 __getitem__() 吗

是 __getitem__()

0
回复
AIStudio810258
#26 回复于2021-01
哈哈哈,不小心写错了

你用的先验概率~~

确实gettime出现更多

0
回复
AIStudio810258
#27 回复于2021-01
你用的先验概率~~ 确实gettime出现更多

或者手指的惯性更能解释~~

0
回复
七年期限
#28 回复于2021-01
thinc #23
七哥水贴有一手了

没 你没看我不发帖子吗...

0
回复
AIStudio810259
#29 回复于2021-01
这个可以在增强函数里设个开关,判断train与否

家在分train数据集那块吗?单独提出来或者干着点

0
回复
thinc
#30 回复于2021-01
都是模块儿化的,分而治之~~

模块化我懂,就是一会儿飞这个文件一会儿飞那个文件,有点晕

0
回复
thinc
#31 回复于2021-01
你用的先验概率~~ 确实gettime出现更多

咋还有先验一说~~

0
回复
七年期限
#32 回复于2021-01
thinc #30
模块化我懂,就是一会儿飞这个文件一会儿飞那个文件,有点晕

跳转一下 然后把它们扔一块去 哈哈

0
回复
AIStudio810259
#33 回复于2021-01
thinc #17
不应该是 __getitem__() 吗

感觉增强卸载getitem里面不大好,毕竟getitem是返回一条对吗?增强在里面,返回几条?怎么处理?

0
回复
thinc
#34 回复于2021-01
感觉增强卸载getitem里面不大好,毕竟getitem是返回一条对吗?增强在里面,返回几条?怎么处理?

用paddle的batch

0
回复
AIStudio810258
#35 回复于2021-01
家在分train数据集那块吗?单独提出来或者干着点

paddleclas里就是直接写在数据处理代码(包括归一化、数据增强处理)里的

0
回复
AIStudio810258
#36 回复于2021-01
家在分train数据集那块吗?单独提出来或者干着点

paddlecals套件里train和eval的代码是重用的,靠一个参数开关区分,所以数据增强、归一化的操作也都靠这个开关控制

0
回复
AIStudio810258
#37 回复于2021-01
thinc #31
咋还有先验一说~~

总体来说,getitme 比 getitem 出现的频率高啊~

0
回复
AIStudio810258
#38 回复于2021-01
thinc #31
咋还有先验一说~~

但是在paddle里 gettime 出现的概率是0,根本没这个函数~~

0
回复
AIStudio810258
#39 回复于2021-01
thinc #31
咋还有先验一说~~

但是在其他程序片段的应用场合用 gettime 获取时间很普遍,就是这个意思

0
回复
AIStudio810258
#40 回复于2021-01
thinc #31
咋还有先验一说~~

其实那么说也不准确~~

就是当时突然想起那个很有名的讲先验概率的例子:一个人穿衬衫,打领带,戴眼镜,问这个人是农民还是图书管理员的概率大。如果不考虑先验概率,当然觉得这个打扮是图书管理员的概率。如果考虑到总人口中图书管理员与农民的比例的话,这个人是农民的概率更大~~

0
回复
AIStudio810258
#41 回复于2021-01
跳转一下 然后把它们扔一块去 哈哈

高见~~

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户