为啥识虫初始代码只能跑一个epoch就被kill
收藏
快速回复
AI Studio平台使用 问答算力相关 1909 18
为啥识虫初始代码只能跑一个epoch就被kill
收藏
快速回复
AI Studio平台使用 问答算力相关 1909 18

百度AI识虫项目里的原始代码,在notebook上训练只能跑一个epoch,感觉这个epoch也没跑完,就才5、6个iter就被kill了,一个batch默认是10,代码不像只能跑一个epoch的样子啊,他有for循环,按说应该循环100次啊!求解答

0
收藏
回复
全部评论(18)
时间顺序
thinc
#2 回复于2020-03

是不是缓存大小的问题?检查一下reader看看

0
回复
AIStudio810258
#3 回复于2020-03

我也遇过。有时出这个问题,有时还能跑。后来就重建了一个项目,就好了。

0
回复
AIStudio810261
#4 回复于2020-03

我是工作人员. 请问具体是哪个项目? 请提供一个项目url(被killed的那个), 我们看看

0
回复
Action
#5 回复于2020-03

显存利用一直在增长 最后被kill了

0
回复
水水水的老师
#6 回复于2020-03

缓存爆了?

0
回复
micahvista
#7 回复于2020-04

显存不够了用Nvidia-smi看看

1
回复
水水水的老师
#8 回复于2020-04
显存不够了用Nvidia-smi看看

正解

0
回复
H
Hey呦呦呦
#9 回复于2020-05
我是工作人员. 请问具体是哪个项目? 请提供一个项目url(被killed的那个), 我们看看

ai识虫项目训练,iter到3994就卡住不动了,什么情况

0
回复
AIStudio810261
#10 回复于2020-05
[图片]ai识虫项目训练,iter到3994就卡住不动了,什么情况

这个得提供一下遇到问题的项目网址

0
回复
AIStudio810259
#11 回复于2020-05

显存不够了呗。

0
回复
AIStudio810258
#12 回复于2020-05

把batch_size设为1试试,就知道了

0
回复
AIStudio810258
#13 回复于2020-05

跑程序时可以在运行窗口的下册状态栏里点出标签,看cpu和gpu使用情况。

0
回复
AIStudio810258
#14 回复于2020-05

gpu有32G和16G的两种,所以有时没问题,有时不行

1
回复
AIStudio810259
#15 回复于2020-05
gpu有32G和16G的两种,所以有时没问题,有时不行

确实如此,运气好就碰到32G的gpu

0
回复
MLTcola
#16 回复于2020-05
显存不够了用Nvidia-smi看看

同意

0
回复
没入门的研究生
#17 回复于2020-05
显存不够了用Nvidia-smi看看

请问如果我想看cpu用什么命令呢?

0
回复
AIStudio810261
#18 回复于2020-06
请问如果我想看cpu用什么命令呢?

理论上使用top或vmstat , 但由于aistudio运行在虚拟机上, 使用这种命令, 看到的其实是宿主机状态. 

因此还是建议直接使用界面来观察. 

 

0
回复
没入门的研究生
#19 回复于2020-06
理论上使用top或vmstat , 但由于aistudio运行在虚拟机上, 使用这种命令, 看到的其实是宿主机状态.  因此还是建议直接使用界面来观察.    [图片]

多谢提醒了,其实用top我看的也不是很懂哈哈哈。

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户