首页 Paddle框架 帖子详情
请教paddle2.0多卡训练显存占用问题
收藏
快速回复
Paddle框架 问答模型训练 758 1
请教paddle2.0多卡训练显存占用问题
收藏
快速回复
Paddle框架 问答模型训练 758 1

基本信息:Ubuntu18.04, CUDA10.2, cuDNN7.6.5, PaddlePaddle v2.0.1, 双RTX6000

第一次尝试双卡训练,发现无论是launch还是spawn,每张显卡的显存占用都比单卡训练时要高一点,我还以为双卡时的显存占用大概会到单卡时的一半。现在这样的话不就不能提高batch size了吗?请问是否有其他设置项目?或者哪位能提供更多的关于多卡训练的资料?

在此先谢谢各位了。

0
收藏
回复
全部评论(1)
时间顺序
A
AIStudio784135
#2 回复于2021-03

去github上查找了问题,原来还要用DistributedBatchSampler才行。实验发现用了之后确实一轮的迭代数量减半了。哎,官方文档更新不及时啊。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户