多卡脚本任务报错
收藏
快速回复
AI Studio平台使用 问答其他 592 5
多卡脚本任务报错
收藏
快速回复
AI Studio平台使用 问答其他 592 5

使用spawn方法进行多卡训练,报这个错误:

Traceback (most recent call last):
File "run.py", line 22, in
dist.spawn(train, args=(opt, vggwpath, lastoutput, output, 1, opt.batchSize, 1, False))
File "/opt/_internal/cpython-3.7.0/lib/python3.7/site-packages/paddle/distributed/spawn.py", line 458, in spawn
format(device))
ValueError: `device` should be a string of `cpu`, 'gpu' or 'xpu', but got gpu:0

0
收藏
回复
全部评论(5)
时间顺序
FutureSI
#2 回复于2021-06

这是我在单gpu主机上训练时报的错误信息。是按文档示例方式写的多卡运行。报错是因为单卡环境么?

0
回复
FutureSI
#3 回复于2021-06

我使用多卡主机训练,结果直接就报失败,连日志都没有,这怎么回事?

0
回复
skywalk163
#4 回复于2021-06

我试了一下,同样的代码,用2.1就是报楼上的错。用2.02 就不报错。

0
回复
FutureSI
#5 回复于2021-06
我试了一下,同样的代码,用2.1就是报楼上的错。用2.02 就不报错。

原来如此,现在我又用回distributed.lauch那个法儿了。就是打印日志,保存模型处理下多进程

0
回复
深渊上的坑
#6 回复于2021-06
我试了一下,同样的代码,用2.1就是报楼上的错。用2.02 就不报错。

看来又是版本问题

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户