首页 Paddle框架 帖子详情
脚本训练的问题
收藏
快速回复
Paddle框架 问答深度学习 1096 2
脚本训练的问题
收藏
快速回复
Paddle框架 问答深度学习 1096 2

单机多卡训练出现  Out of all 4 trainers...报错,

设置python -m paddle.distributed.launch --gpus="0,1,2,3" run.py --log_dir="/root/paddlejob/workspace/output"  没有用,output为空

于是我换单卡训练,却一直卡在inflating: /root/paddlejob/workspace/code/stylegan2-paddle-main/stylegan2_paddle/vector_quantize/__pycache__/__init__.cpython-37.pyc

当然如果我删掉这个文件也还是会卡在别的文件。

我训练开始之前会打印一个“start”可是一直不输出,说明一直卡在这里。请问我该怎么解决?

0
收藏
回复
全部评论(2)
时间顺序
三岁
#2 回复于2022-02

试一下使用这个模板

python -m paddle.distributed.launch --gpu="0,1,2,3" train_dy_mobilenet.py

 

0
回复
fi_Past
#3 回复于2022-03

他就是偶尔会卡

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户