一个完美的dataset应该长什么样?
我认为应该有以下几点:
1.可以对train数据进行数据增强。问题是数据增强放哪一块?我想一次多重增强,比如5倍增强。
2.可以按比例随机抽取划分训练集和测试集。问题是怎么做?感觉我都是写死在里头的,每次实例化后就固定了,是不是不合适?有没有解决办法?
期待大佬们打个样!
你指的是 飞桨封装好的数据集?
我理解的对吗
对……
我觉得paddlex的dataset设计就挺好的,你把数据按目录准备好,配进去就行了
就是样例数据要另开一行命令下,其实多这一步,更方便新用户上手
对对对 自己分配
不过我基本都i是用windows 的那个paddlex 好久不用了
所以,我以前有过把各种类型的数据预处理都做一个项目= =
这种数据的目的主要还是在于方便,既可以让新手快速处理数据,又可以让一些老手测试一下非数据集部分有没有问题,一举两得啊~~
这个可以
没毛病,而且很快就能试一下了
Windows那个很好很强大,要是把lite部分也纳入,我感觉可以一路零代码打通……
看来大家审美还是比较一致的,哈哈哈
除了部署 好像就是0代码
是的,很好很强大。这么说来,完美的dataset看来还需要能够简单可视化
评论区都被你占领了,O(∩_∩)O哈哈~
是的 哈哈
会越来越完善
用户好套用和一键可调用其实有点儿矛盾……
是的
你指的是 飞桨封装好的数据集?
我理解的对吗
对……
我觉得paddlex的dataset设计就挺好的,你把数据按目录准备好,配进去就行了
就是样例数据要另开一行命令下,其实多这一步,更方便新用户上手
对对对 自己分配
不过我基本都i是用windows 的那个paddlex 好久不用了
所以,我以前有过把各种类型的数据预处理都做一个项目= =
这种数据的目的主要还是在于方便,既可以让新手快速处理数据,又可以让一些老手测试一下非数据集部分有没有问题,一举两得啊~~
这个可以
没毛病,而且很快就能试一下了
Windows那个很好很强大,要是把lite部分也纳入,我感觉可以一路零代码打通……
看来大家审美还是比较一致的,哈哈哈
除了部署 好像就是0代码
是的,很好很强大。这么说来,完美的dataset看来还需要能够简单可视化
评论区都被你占领了,O(∩_∩)O哈哈~
是的 哈哈
会越来越完善
用户好套用和一键可调用其实有点儿矛盾……
是的