在AISTUDIO高级算力版本, NVIDA-SMI 可以看到GPU ON, 但 nvidia-smi -q 却常常看不到 CUDA: 10.1[若有的话在 driver version 下面], 有时偶尔有一两次才看到,就算在每天22:00之后也是这样
但只要看不到CUDA: 10.1 paddlepaddle 就无法运行在GPU 上, 相关信息下:, 请看看是什么问题,谢谢
(paddleenv) aistudio@jupyter-203853-674408:~/work/Parakeet/examples/clarinet$ bash train.sh
W0805 22:11:37.658751 1877 init.cc:134] Compiled with WITH_GPU, but no GPU found in runtime.
Traceback (most recent call last):
File "train.py", line 73, in
place = fluid.CUDAPlace(args.device)
C++ Call Stacks (More useful to developers):
0 std::string paddle::platform::GetTraceBackString(char const*&&, char const*, int)
1 paddle::platform::EnforceNotMet::EnforceNotMet(std::__exception_ptr::exception_ptr, char const*, int)
2 paddle::platform::GetCUDADeviceCount()
Error Message Summary:
ExternalError: Cuda error(35), CUDA driver version is insufficient for CUDA runtime version.
[Advise: This indicates that the installed NVIDIA CUDA driver is older than the CUDA runtime library. This is not a supported configuration.Users should install an updated NVIDIA display driver to allow the application to run.] at (/paddle/paddle/fluid/platform/gpu_info.cc:65)
而且,这个高级算力版没运行一会儿【能持续半小时就难得了】系统被中断运行了, 就要重新启动, 请问谁能帮忙看看这个怎么解决, 我该去联系谁? 谢谢
qq群 就可以啊 不过你说的是不是 严重了?
Thank you Randcase, 真是这样的, 这个是发生在 GPU 可以用的一,两次,没半小时没到,当再启动进去时, GPU 也显示挂上了, 但就是GPU 工作不了,nvidia-smi 也可看到 GPU ON,此时 nvidia-smi -q 输出, 没有CUDA: 10.1, 一两次好用的时候, 是可以看到的。在GPU不能工作的时候, 基本没怎么发生很短时间被中断关闭的现象
好吧 我用的 大概 是 一个星期 可能会 挂掉一次吧 毕竟容器机
百度AI Studio 3群:305197519