首页 Paddle框架 帖子详情
显存占满,GPU利用率为0?是什么情况,如何解决?
收藏
快速回复
Paddle框架 问答模型训练深度学习炼丹技巧 3911 5
显存占满,GPU利用率为0?是什么情况,如何解决?
收藏
快速回复
Paddle框架 问答模型训练深度学习炼丹技巧 3911 5

这是我对一个模型进行了修改,将Unet的Decoder由1个变成了多个(很简单的修改,其他地方没有变),下图没有修改。我不知道是代码的问题,还是分配的资源的问题。训练的很慢,这可能是因为Decoder变成了多个。但是我也怀疑,这个分配的卡有点问题,上图显存小了很多,然后电源是ERR。这会是什么情况呢?

0
收藏
回复
全部评论(5)
时间顺序
Player13
#2 回复于2022-05

换了一个环境之后,每一个打印周期训练速度要快上1分钟左右。GPU利用率上去了,代码没问题。那么这一个epoch下来,就慢38分钟左右了啊!!!

0
回复
d
dreamTyou
#3 回复于2022-05

我也遇到了这种卡,电源ERROR,我1050在本机都咖咖乱杀了,在V100跑不动,你敢信?

0
回复
Player13
#4 回复于2022-05
我也遇到了这种卡,电源ERROR,我1050在本机都咖咖乱杀了,在V100跑不动,你敢信?[图片]

多重启几次notebook,换张卡就好了

 
0
回复
EternalAscend
#6 回复于2022-06

这是卡的问题吗.....我还以为代码出问题了,谢谢

0
回复
李长安
#7 回复于2022-07

数据读取模块是不是写的有问题???可以关注一下

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户