单机四卡训练的时候只有一个gpu在训练
收藏
有大佬知道为啥单机四卡训练的时候只有一个gpu在训练,不知道是哪里出了问题
skywalk163
已解决
2#
回复于2023-03
有的训练套件本身只在0号卡输出日志的,所以要排除显示这方面的原因。 可以自己写个简单的多卡训练程序,程序中用print打印,应该可以在4个卡都看见输出。 ppdet套件,默认就是支持多卡。同一个项目,可以分别用1卡和4卡跑一下,可以看到同样的时间,4卡的训练速度更快,也就是训练相同时间,loss要低于1卡,精度要高于1卡。如果这样,就证明4卡跑起来了。
0
收藏
请登录后评论
有的训练套件本身只在0号卡输出日志的,所以要排除显示这方面的原因。
可以自己写个简单的多卡训练程序,程序中用print打印,应该可以在4个卡都看见输出。
ppdet套件,默认就是支持多卡。同一个项目,可以分别用1卡和4卡跑一下,可以看到同样的时间,4卡的训练速度更快,也就是训练相同时间,loss要低于1卡,精度要高于1卡。如果这样,就证明4卡跑起来了。