目标检测教程2第一部分更新啦!
收藏
https://aistudio.baidu.com/aistudio/projectdetail/346455
0
收藏
请登录后评论
我们在做目标检测和超分辨率重建等问题的时候,我们一般是对同一个尺寸的图片进行网络训练。我们希望我们的网络能够适应更多尺寸的图片,传统的做法是使用图像金字塔
SPPNet的核心就是这个SPP层
假设原图输入是224x224,对于conv出来后的输出是13x13x256的,可以理解成有256个这样的Filter,每个Filter对应一张13x13的feature map。接着在这个特征图中找到每一个候选区域映射的区域,spp layer会将每一个候选区域分成1x1,2x2,4x4三张子图,对每个子图的每个区域作max pooling,得出的特征再连接到一起,就是(16+4+1)x256的特征向量,接着给全连接层做进一步处理
SPPNet的完整结构在R-CNN的基础上提出了改进,通过候选区域和feature map的映射,配合SPP层的使用,从而达到了CNN层的共享计算,减少了运算时间
空间金字塔池化层这个方法主要有两个优点: (1) 输入可以是任意大小;(2)精度和速度提高
此外,多层次提取特征还增强了网络的鲁棒性
之所以过去的网络要求输入的图片大小是固定的,如R-CNN,是因为全连接层要求输入的特征数是固定的。而空间金字塔池化结构放在最后一层卷积层和全连接层之间就解决了这个问题。
SPP层是由何凯明大神提出的
何大神的经典之作就是Resnet
谢谢分享
学习了!
谢谢分享学习中
终于看完了,好累。。。。。。
支持楼主
希望楼主继续更新哈
嗯嗯 4月19号我在pycon China有个目标检测的分享
在zoom上直播
到时候会主要过一遍基础的库和论文
主要探讨以下模型的思路