PaddleX任务在AI Studio高级卡训练闪退
收藏
简单的VOC数据集做模板检测训练,配置都是默认的,比如:https://gitee.com/paddlepaddle/PaddleX/blob/release/1.3/examples/remote_sensing/train.py
不管是PaddleX1.3还是2.0+,训练没多久(2.0+更多是还没开始训练)就闪退了,而且直接关闭整个notebook,还得重新点进去。
换成至尊卡就好了……
看资源占用情况,感觉16G的内存很容易就满了,怀疑这是闪退的原因。
然后回看至尊卡的资源消耗,同样的代码,就没到过16G内存……
0
收藏
请登录后评论
好吧,至尊版也闪退,看来闪退就是早晚的问题……以前好像不会这样的啊
BML版本的Notebook
坑姐好!BML版本确实小毛病多,我还在用经典版本。
经典版本如果不停的运行终止,也会卡死,所以我怀疑可能是频繁的运行终止的问题。
解决了吗?
也许是资源分配的问题……
这两天换ppdet没遇到了……已经弄不清谁的问题了
可能试运行期间还是可能有不稳定吧