首页 Paddle框架 帖子详情
ubuntu服务器同时不能运行2个模型~~附代码
收藏
快速回复
Paddle框架 问答深度学习 1780 9
ubuntu服务器同时不能运行2个模型~~附代码
收藏
快速回复
Paddle框架 问答深度学习 1780 9

运行环境:实验室服务器是4tian xp,安装ubuntu 16.04   同时运行的多个docker 容器,paddle版本是paddle-gpu  1.2.0 .post97  ,远程用pycharm运行

遇到问题:编写的unet网络,然后在CPUPlace下可以运行,CUDAPlace模型下,如果gpu其中一块有一块运行就报错 

                    paddle.fluid.core.EnforceNotMet: Enforce failed.

                    如果4块显卡均没有运行程序的话,paddle代码可以正常运行的

                    CUDAPlace是传入的0   然后4块显卡   其他机器运行的tensorflow代码是用的显卡编号为2 

其他:测试多个tensorflow模型用不同显卡可以同时运行的

            如果CUDAPlace是传入的1是调用 显卡编号为1的卡

 

 

 

 

 

 

0
收藏
回复
全部评论(9)
时间顺序
AIRCAS_DYP
#2 回复于2018-12

我知道原因了 ,可是还是没有解决,CUDA_VISIBLE_DEVICES设置了还是无效,我也尝试了在代码中import os 然后设置os.environ["CUDA_VISIBLE_DEVICES"] = "0",想不懂的是为什么paddle单卡运行  居然要把所有显卡的显存都占一点,代码和显卡显存占用如下:

# use GPU
place = fluid.CUDAPlace(0)
# creat executor
exe = fluid.Executor(place)
# init executor
exe.run(fluid.default_startup_program())

0
回复
qqqw151
#3 回复于2018-12
我知道原因了 ,可是还是没有解决,CUDA_VISIBLE_DEVICES设置了还是无效,我也尝试了在代码中import os 然后设置os.environ["CUDA_VISIBLE_DEVICES"] = "0",想不懂的是为什么paddle单卡运行  居然要把所有显卡的显存都占一点,代码和显卡显存占用如下: [代码] [图片]
展开

学习了,楼主好分享

0
回复
梦若隐
#4 回复于2018-12

楼主方便分享下unet的paddle实现代码段嘛,就是主干网络那份部分代码

0
回复
AIRCAS_DYP
#5 回复于2019-01
楼主方便分享下unet的paddle实现代码段嘛,就是主干网络那份部分代码

嗯嗯  好的   我等会上传一份

0
回复
AIRCAS_DYP
#6 回复于2019-01
楼主方便分享下unet的paddle实现代码段嘛,就是主干网络那份部分代码

已上传

0
回复
梦若隐
#7 回复于2019-01
已上传

感觉也没问题啊

0
回复
AIRCAS_DYP
#8 回复于2019-01
感觉也没问题啊

代码没问题的  是paddle的问题   在启动的时候  有几个gpu就要耗几个gpu的200mb显存  如果其他gpu在运行代码  paddle就启动失败

0
回复
梦若隐
#9 回复于2019-01
代码没问题的  是paddle的问题   在启动的时候  有几个gpu就要耗几个gpu的200mb显存  如果其他gpu在运行代码  paddle就启动失败

感觉也没问题啊,不过http://www.paddlepaddle.org/documentation/docs/zh/1.2/user_guides/howto/training/single_node.html

在这里提到执行多卡训练可以使用 fluid.ParallelExecutor 运行训练 fluid.Program,搂着可以看下是否开启`ParallelExecutor `,

最后,提醒下楼主可以把代码段删了

0
回复
梦若隐
#10 回复于2019-01
感觉也没问题啊,不过http://www.paddlepaddle.org/documentation/docs/zh/1.2/user_guides/howto/training/single_node.html 在这里提到执行多卡训练可以使用 fluid.ParallelExecutor 运行训练 fluid.Program,搂着可以看下是否开启`ParallelExecutor `, 最后,提醒下楼主可以把代码段删了
展开

我百度加你好友,贴吧客户端聊下

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户