首页 Paddle框架 帖子详情
paddle的数据加载相关接口有点混乱?
收藏
快速回复
Paddle框架 问答炼丹技巧 779 3
paddle的数据加载相关接口有点混乱?
收藏
快速回复
Paddle框架 问答炼丹技巧 779 3

感觉paddle框架提供的数据加载方式有点混乱,代码组织架构不如pytorch优美。主要是没有提供统一的封装结构,大家有什么好的参考吗?

0
收藏
回复
全部评论(3)
时间顺序
thinc
#2 回复于2020-07

你这里指的是mnist这些内置的数据吗?

0
回复
求你走开啊
#3 回复于2020-07

不是,我是指加载自定义数据的时候。我觉得麻烦之处:

1. 对多进程加载的支持貌似只有fluid.io.Dataloader, 但是这个类在动态图和静态图下的使用有差异, 而且感觉reader源需要单独的命令设置很不合理

2. 如果使用io.batch又不能多进程。

3. 框架里面还有各种七七八八的接口,对初学入门极不友好,这一块文档也不够规范。

上面这些导致我很难设计出一个舒服的项目框架,个人感觉pytorch的Dataset和Dataloader接口封装就十分优美,长远来看真的希望paddle官方可以优化一下这一块。

0
回复
想瘦不能吃
#4 回复于2020-07

已经有了,1.8版本调用fluid.io.Dataset 和fluid.io.Dataloader

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户