为什么开始训练几分钟就自动退出了
收藏
快速回复
AI Studio平台使用 问答Notebook项目 4450 28
为什么开始训练几分钟就自动退出了
收藏
快速回复
AI Studio平台使用 问答Notebook项目 4450 28

Cannot load image

STB Reason : can't fopen

 

(图片上传不了,换了几种格式都不对)

昨晚开着GPU环境什么都不干就不会自动退出,一开始训练才几分钟就自动退出了,环境都关闭了,这是怎么回事?

https://aistudio.baidu.com/aistudio/projectdetail/267007

0
收藏
回复
全部评论(28)
时间顺序
NOOOS
#2 回复于2020-02

资源不够了 随机关些环境

0
回复
小度AIStudio
#3 回复于2020-02
NOOOS #2
资源不够了 随机关些环境

不是这样哦,我们正在排查问题了

0
回复
无知者1215
#4 回复于2020-02

环境关闭具体表现是什么,可以截个图看下吗

0
回复
低音炮的春天
#5 回复于2020-02
不是这样哦,我们正在排查问题了

我刚刚发现好像有人在我的终端里操作了,不是我

0
回复
无知者1215
#6 回复于2020-02
我刚刚发现好像有人在我的终端里操作了,不是我

可能是工程师在后端查看环境状况,您能提供详细点的环境信息吗,或者把项目公开方便我们那工程师追查问题

0
回复
低音炮的春天
#7 回复于2020-02
可能是工程师在后端查看环境状况,您能提供详细点的环境信息吗,或者把项目公开方便我们那工程师追查问题

已经设置成公开了

https://aistudio.baidu.com/bjcpu/user/214314/267007/notebooks/267007.ipynb?redirects=1

0
回复
低音炮的春天
#8 回复于2020-02
可能是工程师在后端查看环境状况,您能提供详细点的环境信息吗,或者把项目公开方便我们那工程师追查问题

会不会是因为我用的是YOLOV3不是飞桨不符合要求?

这个的GPU环境就是训练的时候才会自动关闭,写代码的时候就不会

刚刚截的长条图片上传不能通过审核,等一会我登上GPU环境出现这种情况再截图给你

0
回复
无知者1215
#9 回复于2020-02
会不会是因为我用的是YOLOV3不是飞桨不符合要求? 这个的GPU环境就是训练的时候才会自动关闭,写代码的时候就不会 刚刚截的长条图片上传不能通过审核,等一会我登上GPU环境出现这种情况再截图给你

好的 

0
回复
低音炮的春天
#10 回复于2020-02

感谢关注这个问题!

0
回复
低音炮的春天
#11 回复于2020-02
好的 

感谢关注这个问题

0
回复
低音炮的春天
#12 回复于2020-02
好的 

0
回复
低音炮的春天
#13 回复于2020-02
好的 

大概运行了1046秒,我设置的是2个小时后关闭的

0
回复
无知者1215
#14 回复于2020-02
大概运行了1046秒,我设置的是2个小时后关闭的

您好,您是运行的哪行代码

0
回复
低音炮的春天
#15 回复于2020-02
您好,您是运行的哪行代码

先在notebook上运行这个,然后在终端运行这个:cd /home/aistudio/work/darknet/ && ./darknet detector train cfg/tiny-mine.data cfg/tiny-mine.cfg backup/yolov3-tiny.backup

0
回复
低音炮的春天
#16 回复于2020-02
您好,您是运行的哪行代码

要不就这样了吧,我的号好像被封了,什么都登不上了

感谢关注这个问题

0
回复
无知者1215
#17 回复于2020-02
要不就这样了吧,我的号好像被封了,什么都登不上了 感谢关注这个问题

不好意思,是因为后台检测任务误判,强制释放了资源,这块我们在紧急修复了,给你带来的不便敬请谅解

0
回复
AIStudio810258
#18 回复于2020-02

我有时候因为内存溢出导致中断,然后我就调小batch_size。CV任务真是吃机器啊,幸亏是有AI Studio

0
回复
低音炮的春天
#19 回复于2020-02
我有时候因为内存溢出导致中断,然后我就调小batch_size。CV任务真是吃机器啊,幸亏是有AI Studio

不只是中断,是环境退出,也不是这个原因,训练yolov3版本的时候不会出现这个问题,但是tiny会。我看了GPU占用情况,发现tiny版本的GPU占用不高,可能后台还以为我在干什么,然后就把我关了吧。。。

1
回复
低音炮的春天
#20 回复于2020-02
不好意思,是因为后台检测任务误判,强制释放了资源,这块我们在紧急修复了,给你带来的不便敬请谅解

训练tiny版本的会退出,但是训练完整版的不会。因为我发现训练tiny版本的载入图片资源很慢,GPU大部分时间都是空闲,但是使用的时候一下子就用满了,会不会把你们的V100给搞坏了。。。

0
回复
AIStudio810258
#21 回复于2020-02
不只是中断,是环境退出,也不是这个原因,训练yolov3版本的时候不会出现这个问题,但是tiny会。我看了GPU占用情况,发现tiny版本的GPU占用不高,可能后台还以为我在干什么,然后就把我关了吧。。。
展开

请教,AI Studio是真得把一台机器分配給大家用,而不是虚拟的。所以查看硬件等命令都是可以在console上用的?

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户