模型预测需要设置no_grad()吗?
收藏
预测时候把model 切换到eval(), 还需要设置 no_grad()吗??除了节省显存,不计算梯度会不会更快一点?
0
收藏
请登录后评论
试了一下,确实变快很多。
还有这招,学习了~
但不是backward时才算梯度么,forward也受影响?
梯度是根据链式法则一步步回传,可能forward的时候每个参数都会记录参与的运算方式,然后backward()将loss值传回去,去计算每个参数的梯度值
原来如此,我也试试