关于BatchNorm2D的理解
收藏
大佬们,小白想请教两个问题。
1. 第一个红框处BatchNormal的通道数是12,为啥参数需要48个呢?
2. Non-Trainable Param是代表啥意思呢。数量恰好等于所有BatchNormal的参数数量之和。
希望大佬们帮忙解答。
后面我又单独定义了一个只包括BatchNorm2D层的网络结构,依然还是上述两个问题。
0
收藏
请登录后评论
跟了一下代码发现,权重和偏置参数各12个,是可训练的。然后,均值和方差各12个,是不可训练的。然后for循环给是否可以训练进行复制的时候,方差是否可训练是最后赋值的,把之前的权重偏置赋值的可训练结果给覆盖了。
(代码为:debug跟进summary的源码)