首页 Paddle框架 帖子详情
脚本任务复现 【手写数字识别】之资源配置 运行失败 但无报错信息
收藏
快速回复
Paddle框架 问答深度学习 375 5
脚本任务复现 【手写数字识别】之资源配置 运行失败 但无报错信息
收藏
快速回复
Paddle框架 问答深度学习 375 5

运行失败  但是没有显示具体的报错信息    将 百度架构师手把手带你零基础实践深度学习 的 【手写数字识别】之资源配置  的notebook中的源码复制在脚本任务中  多卡训练  运行失败   

 

训练源码 

 

命令行  python -m paddle.distributed.launch run.py    跑的四卡环境

0
收藏
回复
全部评论(5)
时间顺序
三岁
#2 回复于2021-09

四卡环境不是这个命令吧?

# 启动命令 python -m paddle.distributed.launch --gpu="0,1,2,3" train_dy_mobilenet.py
0
回复
三岁
#3 回复于2021-09
三岁 #2
四卡环境不是这个命令吧? [代码]

以代码实际情况为准

0
回复
l
lueluelue93
#4 回复于2021-09
三岁 #2
四卡环境不是这个命令吧? [代码]

可以 指定gpu编号  也可以 不指定   默认启动所有可见卡

0
回复
三岁
#5 回复于2021-09
可以 指定gpu编号  也可以 不指定   默认启动所有可见卡

确实,你看看把,不行去提个issue(aistudio@baidu.com发邮件即可)

0
回复
l
lueluelue93
#6 回复于2021-09
三岁 #5
确实,你看看把,不行去提个issue(aistudio@baidu.com发邮件即可)

我用spawn  是可以跑 但是  用的是单卡在跑  并没有实现多卡并行

 

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户