GradientClip 都裁剪那些权重?
收藏
会裁剪bn层么?还是只裁剪卷积和全连接层这样的神经网络层
0
收藏
请登录后评论
另外是只裁剪weight,还是也裁剪bias