首页 Paddle框架 帖子详情
调用GPU问题
收藏
快速回复
Paddle框架 问答深度学习 6888 23
调用GPU问题
收藏
快速回复
Paddle框架 问答深度学习 6888 23

W0112 15:49:59.300688 4370 device_context.cc:236] Please NOTE: device: 0, CUDA Capability: 61, Driver API Version: 9.0, Runtime API Version: 9.0
W0112 15:49:59.300832 4370 dynamic_loader.cc:120] Can not find library: libcudnn.so. The process maybe hang. Please try to add the lib path to LD_LIBRARY_PATH.
W0112 15:49:59.300853 4370 dynamic_loader.cc:179] Failed to find dynamic library: libcudnn.so ( libcudnn.so: cannot open shared object file: No such file or directory )
Please specify its path correctly using following ways:
Method. set environment variable LD_LIBRARY_PATH on Linux or DYLD_LIBRARY_PATH on Mac OS.
For instance, issue command: export LD_LIBRARY_PATH=...
Note: After Mac OS 10.11, using the DYLD_LIBRARY_PATH is impossible unless System Integrity Protection (SIP) is disabled.
/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py:779: UserWarning: The following exception is not an EOF exception.
"The following exception is not an EOF exception.")
Traceback (most recent call last):
File "/home/yiyun/mycode/book-develop/01.fit_a_line/train.py", line 201, in
main()
File "/home/yiyun/mycode/book-develop/01.fit_a_line/train.py", line 120, in main
exe.run(startup_program)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 780, in run
six.reraise(*sys.exc_info())
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/six.py", line 696, in reraise
raise value
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 775, in run
use_program_cache=use_program_cache)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 822, in _run_impl
use_program_cache=use_program_cache)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 899, in _run_program
fetch_var_name)
paddle.fluid.core_avx.EnforceNotMet:

--------------------------------------------
C++ Call Stacks (More useful to developers):
--------------------------------------------
0 std::string paddle::platform::GetTraceBackString(char const*&&, char const*, int)
1 paddle::platform::EnforceNotMet::EnforceNotMet(std::__exception_ptr::exception_ptr, char const*, int)
2 paddle::platform::dynload::EnforceCUDNNLoaded(char const*)
3 paddle::platform::CUDADeviceContext::CUDADeviceContext(paddle::platform::CUDAPlace)
4 std::_Function_handler > (), std::reference_wrapper(std::map > >, std::less, std::allocator > > > > >*, paddle::platform::Place)::{lambda()#1} ()> > >::_M_invoke(std::_Any_data const&)
5 std::_Function_handler (), std::__future_base::_Task_setter > >, std::__future_base::_Result_base::_Deleter>, std::unique_ptr > > >::_M_invoke(std::_Any_data const&)
6 std::__future_base::_State_base::_M_do_set(std::function ()>&, bool&)
7 std::__future_base::_Deferred_state(std::map > >, std::less, std::allocator > > > > >*, paddle::platform::Place)::{lambda()#1} ()>, std::unique_ptr > >::_M_run_deferred()
8 paddle::platform::DeviceContextPool::Get(paddle::platform::Place const&)
9 paddle::framework::GarbageCollector::GarbageCollector(paddle::platform::Place const&, unsigned long)
10 paddle::framework::UnsafeFastGPUGarbageCollector::UnsafeFastGPUGarbageCollector(paddle::platform::CUDAPlace const&, unsigned long)
11 paddle::framework::Executor::RunPreparedContext(paddle::framework::ExecutorPrepareContext*, paddle::framework::Scope*, bool, bool, bool)
12 paddle::framework::Executor::Run(paddle::framework::ProgramDesc const&, paddle::framework::Scope*, int, bool, bool, std::vector > const&, bool)

----------------------
Error Message Summary:
----------------------
Error: Cannot load cudnn shared library. Cannot invoke method cudnnGetVersion at (/paddle/paddle/fluid/platform/dynload/cudnn.cc:59)


Process finished with exit code 1

2
收藏
回复
全部评论(23)
时间顺序
DevF
#2 回复于2020-02

我也遇到了相同的问题

0
回复
水水水的老师
#3 回复于2020-02

对照一下 cuda和cudnn 的版本

0
回复
水水水的老师
#4 回复于2020-02

 Cannot load cudnn shared library. Cannot invoke method cudnnGetVersion 

0
回复
勇夫2014
#5 回复于2020-04

paddle问题太多了,放弃吧

0
回复
thinc
#6 回复于2020-04
paddle问题太多了,放弃吧

这跟paddle问题不搭嘎,老哥不会是来砸场的吧?

0
回复
thinc
#7 回复于2020-04

W0112 15:49:59.300832 4370 dynamic_loader.cc:120] Can not find library: libcudnn.so. The process maybe hang.

典型的cuda与paddle-gpu版本不兼容,建议去[paddle官网](https://www.paddlepaddle.org.cn/install/quick)查看对应版本,现在已经升级到1.7了~

0
回复
thinc
#8 回复于2020-04

好像不太支持markdown输入呢...

0
回复
HolliZhao
#9 回复于2020-04

看信息,好像是 cuDNN 没安装对吧。目前paddlepaddle 1.7,在Linux支持到cuda10.1,windows支持到cuda10.0。先要安装cuda,然后还要安装对应版本的 cuDNN。可以检查一下.

0
回复
k
konka201314
#10 回复于2020-05

我在linux上cuda10.1,cudnn7.6.5,都是满足要求的,还是不行

 

1
回复
zhaoguoqing92
#11 回复于2020-05

所以说谁有解决办法

0
回复
thinc
#12 回复于2020-05
所以说谁有解决办法

检查版本

0
回复
zhaoguoqing92
#13 回复于2020-05
thinc #12
检查版本

版本 cuda10.0  cudnn7.6.1  paddle-gpu1.7.2

0
回复
thinc
#14 回复于2020-05
版本 cuda10.0  cudnn7.6.1  paddle-gpu1.7.2

source /etc/profile过了吗

0
回复
L
Lion_Zing
#15 回复于2020-06

应该是和conda一起用的时候出的问题吧?

locate 查找libcudnn.so和libcublas.so的安装位置,

在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。

1
回复
ㄨ◆闭門羹
#16 回复于2020-06
Lion_Zing #15
应该是和conda一起用的时候出的问题吧? locate 查找libcudnn.so和libcublas.so的安装位置, 在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。
展开

可以了!

0
回复
求知者先
#17 回复于2020-06

目前遇到同样的问题,使用的10.1版本的cuda,然后找到对应的cudnn版本为7.6.3,安装好后LD_LIBRARY_PATH也没有问题,就是出现这个情况,官网的安装教材显示 是支持10.1的cuda的,目前没找到问题在哪里。

怀疑是版本问题,因为提示了一句:

Running Verify Fluid Program ...
W0629 22:13:08.011219 7817 device_context.cc:252] Please NOTE: device: 0, CUDA Capability: 75, Driver API Version: 10.2, Runtime API Version: 10.0

准备加个cuda 10.0版本,然后更换软链接 sudo ln /usr/local/cuda /usr/local/cuda-10.0 再看一下。

0
回复
求知者先
#18 回复于2020-06
目前遇到同样的问题,使用的10.1版本的cuda,然后找到对应的cudnn版本为7.6.3,安装好后LD_LIBRARY_PATH也没有问题,就是出现这个情况,官网的安装教材显示 是支持10.1的cuda的,目前没找到问题在哪里。 怀疑是版本问题,因为提示了一句: Running Verify Fluid Program ... W0629 22:13:08.011219 7817 device_context.cc:252] Please NOTE: device: 0, CUDA Capability: 75, Driver API Version: 10.2, Runtime API Version: 10.0 准备加个cuda 10.0版本,然后更换软链接 sudo ln /usr/local/cuda /usr/local/cuda-10.0 再看一下。
展开

安装的cuda 10.1版本,但是提示的接口为10.2的,不知道为什么

0
回复
雾风林
#19 回复于2020-07
Lion_Zing #15
应该是和conda一起用的时候出的问题吧? locate 查找libcudnn.so和libcublas.so的安装位置, 在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。
展开

我也是conda 下使用出现的这个问题,能详细讲一下怎么解决吗

 

0
回复
thinc
#20 回复于2020-07
雾风林 #19
我也是conda 下使用出现的这个问题,能详细讲一下怎么解决吗  

Linux下应该需要建立共享库链接

0
回复
泰迪熊苣苣
#21 回复于2020-07

我来终结这个话题吧,一般情况下是因为LD_LIBRARY_PATH(环境变量)里面没有 libcudnn.so(cudnn安装的时候要添加的,详情百度)的软连接,如何发现添加了的话依然报错,而且是在pycharm里面报错,但是如果你用命令行的话没问题,那因为pychram没有初始化conda里面的软连接

1
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户