SE block 注意力模块加在那里比较好？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

白白加黑127 发布于2020-08

请问做一个5分类的任务，用了 rstnet50+SE block 发现用的显存太多了，导致 batch size 很小，所以不希望在 resnet 每一层都加 SE block ,那么SE注意力模块是加在较前的layer还是加在较后的layer。

其实是想问：SE 注意力模块是在前几层 256x256 数据较多的得到的注意力特征较好，还是在后几层 32x32 得到的注意力特征多呢？那么如果是用原图像 input 作为得到的注意力特征，那么得到的 feature map 是不是就更关注，原图关注的某些特征。这样注意力模块是不是更有价值一点？

不知道这个文字表述是否清晰，请谅解。

0

收藏

回复

全部评论(2)

Henry.coder

#2 回复于2020-08

SE block的一大特点就是提高了特征通道之间的关系，还有其中的squeeze操作就是让feature map提高了全局感受野，我之前做分类任务的时候构造SE-darknet53网络的时候，我是放在darknet的shortcut层的最后，残差块的前面。个人觉得SE block放在resnet网络前几层可能对于全局信息的提取会有很大的帮助，会如你所说的得到的注意力特征更多，但是没有实测过效果，你可以做做试验试试。

1

回复

HrvvvvwvwvI

#3 回复于2020-08

c参考MobileNetV3，FBNetV3，一般往后放

0

回复