2.0可以在forward()手动释放中间变量吗
收藏
运行到一半会报错显存不足,降低batchsize又会降精度,能不能在forward时候手动释放一些中间变量节省显存开销啊?
或者还有别的节省显存的方法吗?nn.ReLU()好像不支持inplace
0
收藏
请登录后评论
可以模拟大bs,多次前向forward计算后在进行一次backward反向
不是1次forward对应1次backward