SE block 注意力模块加在那里比较好?
收藏
请问做一个5分类的任务,用了 rstnet50+SE block 发现用的显存太多了,导致 batch size 很小,所以不希望在 resnet 每一层都加 SE block ,那么SE注意力模块是加在较前的layer还是加在较后的layer。
其实是想问:SE 注意力模块是在前几层 256x256 数据较多的得到的注意力特征较好,还是在后几层 32x32 得到的注意力特征多呢? 那么如果是用原图像 input 作为得到的注意力特征,那么得到的 feature map 是不是就更关注,原图关注的某些特征。这样注意力模块是不是更有价值一点?
不知道这个文字表述是否清晰,请谅解。
0
收藏
请登录后评论
SE block的一大特点就是提高了特征通道之间的关系,还有其中的squeeze操作就是让feature map提高了全局感受野,我之前做分类任务的时候构造SE-darknet53网络的时候,我是放在darknet的shortcut层的最后,残差块的前面。个人觉得SE block放在resnet网络前几层可能对于全局信息的提取会有很大的帮助,会如你所说的得到的注意力特征更多,但是没有实测过效果,你可以做做试验试试。
c参考MobileNetV3,FBNetV3,一般往后放