真是流弊!
以前不太清楚
应该不行
我才知道
设置时间延迟啊,比如哪怕一分钟的延迟,A掉了,一分钟后B才掉,这个时候B再挂上A,A上线,然后再挂B,如此往复。
然而前天我还碰到了远程主机已断开的问题。。。
哈哈哈,不晚不晚
高人的玩法,等着验证~~
就这个意思
估计这种玩法得悄咪咪的搞~~
所以,我现在都跑程序设一个每小时保存模型的“断点续炼” checkpoint 灾备~~
对哦,还可以按时间保存,以前没想到
想学学
这咋搞的。。。每小时保存 time模块吗
不过每个epoch保存还是最方便的
应该不能吧
能跑一会
怎么搞啊,求指教!
我猜用time模块 一小时存一次哈哈哈
这个可以尝试一下!
新技能都是被迫练就的
以前不太清楚
应该不行
我才知道
设置时间延迟啊,比如哪怕一分钟的延迟,A掉了,一分钟后B才掉,这个时候B再挂上A,A上线,然后再挂B,如此往复。
然而前天我还碰到了远程主机已断开的问题。。。
哈哈哈,不晚不晚
高人的玩法,等着验证~~
就这个意思
估计这种玩法得悄咪咪的搞~~
所以,我现在都跑程序设一个每小时保存模型的“断点续炼” checkpoint 灾备~~
对哦,还可以按时间保存,以前没想到
想学学
这咋搞的。。。每小时保存 time模块吗
不过每个epoch保存还是最方便的
应该不能吧
能跑一会
怎么搞啊,求指教!
我猜用time模块 一小时存一次哈哈哈
这个可以尝试一下!
新技能都是被迫练就的