请教paddle2.0多卡训练显存占用问题

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

A AIStudio784135 发布于2021-03

基本信息：Ubuntu18.04, CUDA10.2, cuDNN7.6.5, PaddlePaddle v2.0.1, 双RTX6000

第一次尝试双卡训练，发现无论是launch还是spawn，每张显卡的显存占用都比单卡训练时要高一点，我还以为双卡时的显存占用大概会到单卡时的一半。现在这样的话不就不能提高batch size了吗？请问是否有其他设置项目？或者哪位能提供更多的关于多卡训练的资料？

在此先谢谢各位了。

0

收藏

回复

全部评论(1)

A

AIStudio784135

#2 回复于2021-03

去github上查找了问题，原来还要用DistributedBatchSampler才行。实验发现用了之后确实一轮的迭代数量减半了。哎，官方文档更新不及时啊。

0

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~