如何自己在Dataset里shuffle
收藏
因为同时使用多个Dataloader会因为shm大小的限制报错。所以需要在单个Dataloader里载入多个数据集。而Dataloader只能整体将数据shuffle。如何做到每个数据集里的数据单独shuffle呢?
0
收藏
请登录后评论
好像只好不使用Dataloader的shuffle,然后每一轮结束时单独对每个数据集列表路径都手动shuffle再合并,用的时候再根据数据集大小划分成的几个区间来分别使用数据集?不知道有没简单方法。
我甚至想过在batch里做“小规模shuffle”,但一些gan任务batch size就是1啊
Dataset只有在构造函数里读一次文件列表。epoch循环里不重新读取,只是每次重新shuffle那个sampler吧
而这种shuffle不会影响两个数据集的匹配关系