PaddleX任务在AI Studio高级卡训练闪退
收藏
快速回复
AI Studio平台使用 其他Notebook项目 2236 6
PaddleX任务在AI Studio高级卡训练闪退
收藏
快速回复
AI Studio平台使用 其他Notebook项目 2236 6

简单的VOC数据集做模板检测训练,配置都是默认的,比如:https://gitee.com/paddlepaddle/PaddleX/blob/release/1.3/examples/remote_sensing/train.py

不管是PaddleX1.3还是2.0+,训练没多久(2.0+更多是还没开始训练)就闪退了,而且直接关闭整个notebook,还得重新点进去。

换成至尊卡就好了……

看资源占用情况,感觉16G的内存很容易就满了,怀疑这是闪退的原因。

然后回看至尊卡的资源消耗,同样的代码,就没到过16G内存……

 

0
收藏
回复
全部评论(6)
时间顺序
深渊上的坑
#2 回复于2021-12

好吧,至尊版也闪退,看来闪退就是早晚的问题……以前好像不会这样的啊

BML版本的Notebook

0
回复
十进制到二进制
#3 回复于2021-12

坑姐好!BML版本确实小毛病多,我还在用经典版本。

经典版本如果不停的运行终止,也会卡死,所以我怀疑可能是频繁的运行终止的问题。

0
回复
5
529112036yk
#4 回复于2021-12

解决了吗?

0
回复
深渊上的坑
#5 回复于2022-01
坑姐好!BML版本确实小毛病多,我还在用经典版本。 经典版本如果不停的运行终止,也会卡死,所以我怀疑可能是频繁的运行终止的问题。

也许是资源分配的问题……

0
回复
深渊上的坑
#6 回复于2022-01
解决了吗?

这两天换ppdet没遇到了……已经弄不清谁的问题了

0
回复
深渊上的坑
#7 回复于2022-01
坑姐好!BML版本确实小毛病多,我还在用经典版本。 经典版本如果不停的运行终止,也会卡死,所以我怀疑可能是频繁的运行终止的问题。

可能试运行期间还是可能有不稳定吧

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户