ubuntu服务器同时不能运行2个模型~~附代码

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

AIRCAS_DYP 发布于2018-12

运行环境：实验室服务器是4tian xp，安装ubuntu 16.04 同时运行的多个docker 容器，paddle版本是paddle-gpu 1.2.0 .post97 ，远程用pycharm运行

遇到问题：编写的unet网络，然后在CPUPlace下可以运行，CUDAPlace模型下，如果gpu其中一块有一块运行就报错

paddle.fluid.core.EnforceNotMet: Enforce failed.

如果4块显卡均没有运行程序的话，paddle代码可以正常运行的

CUDAPlace是传入的0 然后4块显卡其他机器运行的tensorflow代码是用的显卡编号为2

其他：测试多个tensorflow模型用不同显卡可以同时运行的

如果CUDAPlace是传入的1是调用显卡编号为1的卡

全部评论(9)

AIRCAS_DYP

#2 回复于2018-12

我知道原因了，可是还是没有解决，CUDA_VISIBLE_DEVICES设置了还是无效，我也尝试了在代码中import os 然后设置os.environ["CUDA_VISIBLE_DEVICES"] = "0"，想不懂的是为什么paddle单卡运行居然要把所有显卡的显存都占一点，代码和显卡显存占用如下：

# use GPU
place = fluid.CUDAPlace(0)
# creat executor
exe = fluid.Executor(place)
# init executor
exe.run(fluid.default_startup_program())

qqqw151

#3 回复于2018-12

AIRCAS_DYP #2

展开

学习了，楼主好分享

梦若隐

#4 回复于2018-12

楼主方便分享下unet的paddle实现代码段嘛，就是主干网络那份部分代码

AIRCAS_DYP

#5 回复于2019-01

梦若隐 #4

楼主方便分享下unet的paddle实现代码段嘛，就是主干网络那份部分代码

嗯嗯好的我等会上传一份

AIRCAS_DYP

#6 回复于2019-01

梦若隐 #4

楼主方便分享下unet的paddle实现代码段嘛，就是主干网络那份部分代码

已上传

梦若隐

#7 回复于2019-01

AIRCAS_DYP #6

已上传

感觉也没问题啊

AIRCAS_DYP

#8 回复于2019-01

梦若隐 #7

感觉也没问题啊

代码没问题的是paddle的问题在启动的时候有几个gpu就要耗几个gpu的200mb显存如果其他gpu在运行代码 paddle就启动失败

梦若隐

#9 回复于2019-01

AIRCAS_DYP #8

代码没问题的是paddle的问题在启动的时候有几个gpu就要耗几个gpu的200mb显存如果其他gpu在运行代码 paddle就启动失败

感觉也没问题啊，不过http://www.paddlepaddle.org/documentation/docs/zh/1.2/user_guides/howto/training/single_node.html

在这里提到执行多卡训练可以使用 fluid.ParallelExecutor 运行训练 fluid.Program，搂着可以看下是否开启`ParallelExecutor `,

最后，提醒下楼主可以把代码段删了

梦若隐

#10 回复于2019-01

梦若隐 #9

感觉也没问题啊，不过http://www.paddlepaddle.org/documentation/docs/zh/1.2/user_guides/howto/training/single_node.html 在这里提到执行多卡训练可以使用 fluid.ParallelExecutor 运行训练 fluid.Program，搂着可以看下是否开启`ParallelExecutor `, 最后，提醒下楼主可以把代码段删了

展开

我百度加你好友，贴吧客户端聊下

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~