GPU 无法参与运算
收藏
快速回复
AI Studio平台使用 问答Notebook项目 1402 5
GPU 无法参与运算
收藏
快速回复
AI Studio平台使用 问答Notebook项目 1402 5

HI,

 

在AISTUDIO高级算力版本, NVIDA-SMI 可以看到GPU ON, 但 nvidia-smi -q 却常常看不到 CUDA: 10.1[若有的话在 driver version 下面], 有时偶尔有一两次才看到,就算在每天22:00之后也是这样

但只要看不到CUDA: 10.1  paddlepaddle 就无法运行在GPU 上, 相关信息下:, 请看看是什么问题,谢谢

(paddleenv) aistudio@jupyter-203853-674408:~/work/Parakeet/examples/clarinet$ bash train.sh
W0805 22:11:37.658751 1877 init.cc:134] Compiled with WITH_GPU, but no GPU found in runtime.
Traceback (most recent call last):
File "train.py", line 73, in
place = fluid.CUDAPlace(args.device)
paddle.fluid.core_avx.EnforceNotMet:

--------------------------------------------
C++ Call Stacks (More useful to developers):
--------------------------------------------
0 std::string paddle::platform::GetTraceBackString(char const*&&, char const*, int)
1 paddle::platform::EnforceNotMet::EnforceNotMet(std::__exception_ptr::exception_ptr, char const*, int)
2 paddle::platform::GetCUDADeviceCount()

----------------------
Error Message Summary:
----------------------
ExternalError: Cuda error(35), CUDA driver version is insufficient for CUDA runtime version.
[Advise: This indicates that the installed NVIDIA CUDA driver is older than the CUDA runtime library. This is not a supported configuration.Users should install an updated NVIDIA display driver to allow the application to run.] at (/paddle/paddle/fluid/platform/gpu_info.cc:65)

 

0
收藏
回复
全部评论(5)
时间顺序
r
ryantan0
#2 回复于2020-08

而且,这个高级算力版没运行一会儿【能持续半小时就难得了】系统被中断运行了, 就要重新启动, 请问谁能帮忙看看这个怎么解决, 我该去联系谁? 谢谢

0
回复
lianzhang132
#3 回复于2020-08
而且,这个高级算力版没运行一会儿【能持续半小时就难得了】系统被中断运行了, 就要重新启动, 请问谁能帮忙看看这个怎么解决, 我该去联系谁? 谢谢

qq群 就可以啊 不过你说的是不是 严重了?

0
回复
r
ryantan0
#4 回复于2020-08
qq群 就可以啊 不过你说的是不是 严重了?

Thank you Randcase,  真是这样的, 这个是发生在 GPU 可以用的一,两次,没半小时没到,当再启动进去时, GPU 也显示挂上了, 但就是GPU 工作不了,nvidia-smi 也可看到 GPU ON,此时 nvidia-smi -q 输出, 没有CUDA: 10.1,  一两次好用的时候, 是可以看到的。在GPU不能工作的时候, 基本没怎么发生很短时间被中断关闭的现象

0
回复
lianzhang132
#5 回复于2020-08
Thank you Randcase,  真是这样的, 这个是发生在 GPU 可以用的一,两次,没半小时没到,当再启动进去时, GPU 也显示挂上了, 但就是GPU 工作不了,nvidia-smi 也可看到 GPU ON,此时 nvidia-smi -q 输出, 没有CUDA: 10.1,  一两次好用的时候, 是可以看到的。在GPU不能工作的时候, 基本没怎么发生很短时间被中断关闭的现象
展开

好吧 我用的 大概 是 一个星期 可能会 挂掉一次吧  毕竟容器机 

0
回复
thinc
#6 回复于2020-08

辛苦去群里反馈下吧,应该是平台有点小问题

百度AI Studio 3群:305197519

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户