在 ai studio 上搭建网络时,只需单步执行模型计算,所以为了节省资源(和算力卡)常常用cpu主机,但有时会自动重启而失去保存的中间变量。这肿么回事~
CPU的Kernel性能不如GPU啊
检查下是不是爆内存了
可以开个终端用ps命令监控着
不是运行时自动重启,时随时自动重启
然后还自动重启不了,得手动再点一次
有时候实在受不了就干脆gpu了~~
竟然还有这种事?俺没有遇到过哎~
随时? 辛苦再遇到截个图贴一下吧. 或者发邮件到aistudio@baidu.com (别忘了带上项目链接)
还是感觉用GPU好点
有没有什么提示,或者看看系统日志
原来只有我这样。。。
得卡厚才行~
就是提示“系统重新连接中”,其实重启也没什么,即使中间变量没了也没太大关系,毕竟cpu能跑的东西也没多大,最大的影响是:重启时没有代码补全~
一说让我截屏,半天没犯了。。。
就是这个现象:
右上角会显示“自动重启中”
这次重启的是这个项目:
https://aistudio.baidu.com/aistudio/projectdetail/1876863
但是我感觉不是和项目关联的
时间是不到早上6点,重启也不行,得重新进个主机了
自动重启有可能是显存什么超了,一般换gpu就行,有些时候是数据没有处理好也会有类似问题(我遇到是这么处理的)
CPU的Kernel性能不如GPU啊
检查下是不是爆内存了
可以开个终端用ps命令监控着
不是运行时自动重启,时随时自动重启
然后还自动重启不了,得手动再点一次
有时候实在受不了就干脆gpu了~~
竟然还有这种事?俺没有遇到过哎~
随时? 辛苦再遇到截个图贴一下吧. 或者发邮件到aistudio@baidu.com (别忘了带上项目链接)
还是感觉用GPU好点
有没有什么提示,或者看看系统日志
原来只有我这样。。。
得卡厚才行~
就是提示“系统重新连接中”,其实重启也没什么,即使中间变量没了也没太大关系,毕竟cpu能跑的东西也没多大,最大的影响是:重启时没有代码补全~
一说让我截屏,半天没犯了。。。
就是这个现象:
右上角会显示“自动重启中”
这次重启的是这个项目:
https://aistudio.baidu.com/aistudio/projectdetail/1876863
但是我感觉不是和项目关联的
时间是不到早上6点,重启也不行,得重新进个主机了
自动重启有可能是显存什么超了,一般换gpu就行,有些时候是数据没有处理好也会有类似问题(我遇到是这么处理的)