后台任务运行的空间限制20G
收藏
快速回复
AI Studio平台使用 问答算力相关Notebook项目 2209 12
后台任务运行的空间限制20G
收藏
快速回复
AI Studio平台使用 问答算力相关Notebook项目 2209 12

这个限制20G是最终的输出结果,还是运行的过程中就不能超过20G

跑了个paddledetection项目 存的模型大概20g的时候,还没跑完任务就失败了

跑的过程中将模型存到data目录下是否可以解决呢

0
收藏
回复
全部评论(12)
时间顺序
深渊上的坑
#2 回复于2021-07

不如用脚本任务

0
回复
深渊上的坑
#3 回复于2021-07

或者就是减少checkpoint了……

0
回复
O国殇O
#4 回复于2021-07
或者就是减少checkpoint了……

之前总感觉脚本任务不方便调试,没后台任务直接调通就能跑。看来还是要研究一下脚本任务了

0
回复
O国殇O
#5 回复于2021-07
不如用脚本任务

问一下大佬,脚本任务里面的p40算力和v100差很多吗,若是用其他的v100多卡训练除了要改学习率*卡数,还有什么地方要注意.多卡训练就是相对于训练速度提速多倍吗

0
回复
深渊上的坑
#6 回复于2021-07
之前总感觉脚本任务不方便调试,没后台任务直接调通就能跑。看来还是要研究一下脚本任务了

现在脚本任务好多了,提供了shell支持

0
回复
深渊上的坑
#7 回复于2021-07
问一下大佬,脚本任务里面的p40算力和v100差很多吗,若是用其他的v100多卡训练除了要改学习率*卡数,还有什么地方要注意.多卡训练就是相对于训练速度提速多倍吗

P40是单卡,正常来说,多卡很难抢到吧……更不要说调试了,以前抢到过几次

0
回复
深渊上的坑
#8 回复于2021-07
问一下大佬,脚本任务里面的p40算力和v100差很多吗,若是用其他的v100多卡训练除了要改学习率*卡数,还有什么地方要注意.多卡训练就是相对于训练速度提速多倍吗

比较棘手的问题是,不同模型库多卡如何用、如何表现都不太统一……

0
回复
FutureSI
#9 回复于2021-07
问一下大佬,脚本任务里面的p40算力和v100差很多吗,若是用其他的v100多卡训练除了要改学习率*卡数,还有什么地方要注意.多卡训练就是相对于训练速度提速多倍吗

参考文档:

https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/02_paddle2.0_develop/06_device_cn.html#danjiduokaxunlian

0
回复
FutureSI
#10 回复于2021-07

还要注意使用 DistributedBatchSampler 进行数据采样

0
回复
FutureSI
#11 回复于2021-07

我遇上的问题是,解压数据集后文件数量超限了。请问数据集你是解压到哪里的?量大概多少?

0
回复
FutureSI
#12 回复于2021-07

我试过无法在data目录下解压,记得会报错。解压后数据集图片数量就超5000了。有位大佬出招用完后结束训练前删除解压的数据集。后来干脆用脚本了。如果你试好了notebook后台任务,也请告知下肿么弄的~~

0
回复
O国殇O
#13 回复于2021-07
FutureSI #12
我试过无法在data目录下解压,记得会报错。解压后数据集图片数量就超5000了。有位大佬出招用完后结束训练前删除解压的数据集。后来干脆用脚本了。如果你试好了notebook后台任务,也请告知下肿么弄的~~
展开

我的数据集没那么多,只有一千多张图片

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户