显存占满,GPU利用率为0?是什么情况,如何解决?
收藏
这是我对一个模型进行了修改,将Unet的Decoder由1个变成了多个(很简单的修改,其他地方没有变),下图没有修改。我不知道是代码的问题,还是分配的资源的问题。训练的很慢,这可能是因为Decoder变成了多个。但是我也怀疑,这个分配的卡有点问题,上图显存小了很多,然后电源是ERR。这会是什么情况呢?
0
收藏
请登录后评论
换了一个环境之后,每一个打印周期训练速度要快上1分钟左右。GPU利用率上去了,代码没问题。那么这一个epoch下来,就慢38分钟左右了啊!!!
我也遇到了这种卡,电源ERROR,我1050在本机都咖咖乱杀了,在V100跑不动,你敢信?
多重启几次notebook,换张卡就好了
这是卡的问题吗.....我还以为代码出问题了,谢谢
数据读取模块是不是写的有问题???可以关注一下