首页 Paddle框架 帖子详情
单机四卡训练的时候只有一个gpu在训练 已解决
收藏
快速回复
Paddle框架 问答模型训练 1198 1
单机四卡训练的时候只有一个gpu在训练 已解决
收藏
快速回复
Paddle框架 问答模型训练 1198 1

有大佬知道为啥单机四卡训练的时候只有一个gpu在训练,不知道是哪里出了问题

skywalk163
已解决
2# 回复于2023-03
有的训练套件本身只在0号卡输出日志的,所以要排除显示这方面的原因。 可以自己写个简单的多卡训练程序,程序中用print打印,应该可以在4个卡都看见输出。 ppdet套件,默认就是支持多卡。同一个项目,可以分别用1卡和4卡跑一下,可以看到同样的时间,4卡的训练速度更快,也就是训练相同时间,loss要低于1卡,精度要高于1卡。如果这样,就证明4卡跑起来了。
展开
0
收藏
回复
全部评论(1)
时间顺序
skywalk163
#2 回复于2023-03

有的训练套件本身只在0号卡输出日志的,所以要排除显示这方面的原因。

可以自己写个简单的多卡训练程序,程序中用print打印,应该可以在4个卡都看见输出。

ppdet套件,默认就是支持多卡。同一个项目,可以分别用1卡和4卡跑一下,可以看到同样的时间,4卡的训练速度更快,也就是训练相同时间,loss要低于1卡,精度要高于1卡。如果这样,就证明4卡跑起来了。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户