脚本任务复现 【手写数字识别】之资源配置 运行失败 但无报错信息
收藏
运行失败 但是没有显示具体的报错信息 将 百度架构师手把手带你零基础实践深度学习 的 【手写数字识别】之资源配置 的notebook中的源码复制在脚本任务中 多卡训练 运行失败
训练源码
命令行 python -m paddle.distributed.launch run.py 跑的四卡环境
0
收藏
请登录后评论
四卡环境不是这个命令吧?
以代码实际情况为准
可以 指定gpu编号 也可以 不指定 默认启动所有可见卡
确实,你看看把,不行去提个issue(aistudio@baidu.com发邮件即可)
我用spawn 是可以跑 但是 用的是单卡在跑 并没有实现多卡并行