调用GPU问题

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

小小云书虫发布于2020-01

W0112 15:49:59.300688 4370 device_context.cc:236] Please NOTE: device: 0, CUDA Capability: 61, Driver API Version: 9.0, Runtime API Version: 9.0
W0112 15:49:59.300832 4370 dynamic_loader.cc:120] Can not find library: libcudnn.so. The process maybe hang. Please try to add the lib path to LD_LIBRARY_PATH.
W0112 15:49:59.300853 4370 dynamic_loader.cc:179] Failed to find dynamic library: libcudnn.so ( libcudnn.so: cannot open shared object file: No such file or directory )
Please specify its path correctly using following ways:
Method. set environment variable LD_LIBRARY_PATH on Linux or DYLD_LIBRARY_PATH on Mac OS.
For instance, issue command: export LD_LIBRARY_PATH=...
Note: After Mac OS 10.11, using the DYLD_LIBRARY_PATH is impossible unless System Integrity Protection (SIP) is disabled.
/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py:779: UserWarning: The following exception is not an EOF exception.
"The following exception is not an EOF exception.")
Traceback (most recent call last):
File "/home/yiyun/mycode/book-develop/01.fit_a_line/train.py", line 201, in
main()
File "/home/yiyun/mycode/book-develop/01.fit_a_line/train.py", line 120, in main
exe.run(startup_program)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 780, in run
six.reraise(*sys.exc_info())
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/six.py", line 696, in reraise
raise value
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 775, in run
use_program_cache=use_program_cache)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 822, in _run_impl
use_program_cache=use_program_cache)
File "/home/yiyun/mycode/CCPD-master/venv/lib/python3.6/site-packages/paddle/fluid/executor.py", line 899, in _run_program
fetch_var_name)
paddle.fluid.core_avx.EnforceNotMet:

--------------------------------------------
C++ Call Stacks (More useful to developers):
--------------------------------------------
0 std::string paddle::platform::GetTraceBackString(char const*&&, char const*, int)
1 paddle::platform::EnforceNotMet::EnforceNotMet(std::__exception_ptr::exception_ptr, char const*, int)
2 paddle::platform::dynload::EnforceCUDNNLoaded(char const*)
3 paddle::platform::CUDADeviceContext::CUDADeviceContext(paddle::platform::CUDAPlace)
4 std::_Function_handler > (), std::reference_wrapper(std::map > >, std::less, std::allocator > > > > >*, paddle::platform::Place)::{lambda()#1} ()> > >::_M_invoke(std::_Any_data const&)
5 std::_Function_handler (), std::__future_base::_Task_setter > >, std::__future_base::_Result_base::_Deleter>, std::unique_ptr > > >::_M_invoke(std::_Any_data const&)
6 std::__future_base::_State_base::_M_do_set(std::function ()>&, bool&)
7 std::__future_base::_Deferred_state(std::map > >, std::less, std::allocator > > > > >*, paddle::platform::Place)::{lambda()#1} ()>, std::unique_ptr > >::_M_run_deferred()
8 paddle::platform::DeviceContextPool::Get(paddle::platform::Place const&)
9 paddle::framework::GarbageCollector::GarbageCollector(paddle::platform::Place const&, unsigned long)
10 paddle::framework::UnsafeFastGPUGarbageCollector::UnsafeFastGPUGarbageCollector(paddle::platform::CUDAPlace const&, unsigned long)
11 paddle::framework::Executor::RunPreparedContext(paddle::framework::ExecutorPrepareContext*, paddle::framework::Scope*, bool, bool, bool)
12 paddle::framework::Executor::Run(paddle::framework::ProgramDesc const&, paddle::framework::Scope*, int, bool, bool, std::vector > const&, bool)

----------------------
Error Message Summary:
----------------------
Error: Cannot load cudnn shared library. Cannot invoke method cudnnGetVersion at (/paddle/paddle/fluid/platform/dynload/cudnn.cc:59)

Process finished with exit code 1

全部评论(23)

DevF

#2 回复于2020-02

我也遇到了相同的问题

水水水的老师

#3 回复于2020-02

对照一下 cuda和cudnn 的版本

水水水的老师

#4 回复于2020-02

Cannot load cudnn shared library. Cannot invoke method cudnnGetVersion

勇

勇夫2014

#5 回复于2020-04

paddle问题太多了,放弃吧

thinc

#6 回复于2020-04

勇夫2014 #5

paddle问题太多了,放弃吧

这跟paddle问题不搭嘎，老哥不会是来砸场的吧？

thinc

#7 回复于2020-04

W0112 15:49:59.300832 4370 dynamic_loader.cc:120] Can not find library: libcudnn.so. The process maybe hang.

典型的cuda与paddle-gpu版本不兼容，建议去[paddle官网](https://www.paddlepaddle.org.cn/install/quick)查看对应版本，现在已经升级到1.7了~

thinc

#8 回复于2020-04

好像不太支持markdown输入呢...

HolliZhao

#9 回复于2020-04

看信息，好像是 cuDNN 没安装对吧。目前paddlepaddle 1.7，在Linux支持到cuda10.1，windows支持到cuda10.0。先要安装cuda，然后还要安装对应版本的 cuDNN。可以检查一下.

konka201314

#10 回复于2020-05

我在linux上cuda10.1，cudnn7.6.5，都是满足要求的，还是不行

zhaoguoqing92

#11 回复于2020-05

所以说谁有解决办法

thinc

#12 回复于2020-05

zhaoguoqing92 #11

所以说谁有解决办法

检查版本

zhaoguoqing92

#13 回复于2020-05

thinc #12

检查版本

版本 cuda10.0 cudnn7.6.1 paddle-gpu1.7.2

thinc

#14 回复于2020-05

zhaoguoqing92 #13

版本 cuda10.0 cudnn7.6.1 paddle-gpu1.7.2

source /etc/profile过了吗

Lion_Zing

#15 回复于2020-06

应该是和conda一起用的时候出的问题吧？

locate 查找libcudnn.so和libcublas.so的安装位置，

在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。

ㄨ

ㄨ◆闭門羹

#16 回复于2020-06

Lion_Zing #15

应该是和conda一起用的时候出的问题吧？ locate 查找libcudnn.so和libcublas.so的安装位置，在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。

展开

可以了！

求

求知者先

#17 回复于2020-06

目前遇到同样的问题，使用的10.1版本的cuda，然后找到对应的cudnn版本为7.6.3，安装好后LD_LIBRARY_PATH也没有问题，就是出现这个情况，官网的安装教材显示是支持10.1的cuda的，目前没找到问题在哪里。

怀疑是版本问题，因为提示了一句：

Running Verify Fluid Program ...
W0629 22:13:08.011219 7817 device_context.cc:252] Please NOTE: device: 0, CUDA Capability: 75, Driver API Version: 10.2, Runtime API Version: 10.0

准备加个cuda 10.0版本，然后更换软链接 sudo ln /usr/local/cuda /usr/local/cuda-10.0 再看一下。

求

求知者先

#18 回复于2020-06

求知者先 #17

目前遇到同样的问题，使用的10.1版本的cuda，然后找到对应的cudnn版本为7.6.3，安装好后LD_LIBRARY_PATH也没有问题，就是出现这个情况，官网的安装教材显示是支持10.1的cuda的，目前没找到问题在哪里。怀疑是版本问题，因为提示了一句： Running Verify Fluid Program ... W0629 22:13:08.011219 7817 device_context.cc:252] Please NOTE: device: 0, CUDA Capability: 75, Driver API Version: 10.2, Runtime API Version: 10.0 准备加个cuda 10.0版本，然后更换软链接 sudo ln /usr/local/cuda /usr/local/cuda-10.0 再看一下。

展开

安装的cuda 10.1版本，但是提示的接口为10.2的，不知道为什么

雾

雾风林

#19 回复于2020-07

Lion_Zing #15

应该是和conda一起用的时候出的问题吧？ locate 查找libcudnn.so和libcublas.so的安装位置，在LD_LIBRARY_PATH 路径下创建libcudnn.so和libcublas.so的软链接。

展开

我也是conda 下使用出现的这个问题，能详细讲一下怎么解决吗

thinc

#20 回复于2020-07

雾风林 #19

我也是conda 下使用出现的这个问题，能详细讲一下怎么解决吗

Linux下应该需要建立共享库链接

泰迪熊苣苣

#21 回复于2020-07

我来终结这个话题吧，一般情况下是因为LD_LIBRARY_PATH（环境变量）里面没有 libcudnn.so（cudnn安装的时候要添加的，详情百度）的软连接，如何发现添加了的话依然报错，而且是在pycharm里面报错，但是如果你用命令行的话没问题，那因为pychram没有初始化conda里面的软连接

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~