【AI达人养成营】关于卷积神经网络的基础概念
收藏
在学习卷积神经网络之前先了解下线性网络:
一般线性方程为 Y=Kx+b ,K是固定不变的,b是偏置。
在卷积网络中见到最多的表达式为:f=Wx+b,其中X是定的,变动W即可。
卷积神经网络(CNN)可用于特征提取,其包含:输入层,卷积层,池化层,全连接层。
现在分别介绍下每个流程:
1.输入层(input):
在图像处理中,输入的数据不是一张肉眼所见的一张彩色图面,而是要将图面转化为矩阵的形式进行输入。例如一张32*32彩色图片由RGB构成,有3个通道。因此输入的数据为32*32*3,其中32*32为图片的矩阵形式。
2.卷积层(conv):
卷积做了什么:将RGB通道分别拆开进行处理(卷积),再整合一起。
卷积核是经过多次计算出来的,卷积核与输入图像进行卷积可得到所要提取的特征。
卷积的过程就是图中橙色部分与卷积核进行一个对应位置相乘,再将得到的结果进行相加,
特征图(feature map):卷积一次后得到的结果。
对于一张彩色图片,其含3个通道,那么卷积核也可以有3个与其对应相乘。
卷积结果计算:
在图中可以看到,特征图大小与输入图像及卷积核相关。图中的例子,输入图像为6*6的矩阵,卷积核为3*3,步长为1,则特征图大小为: , 行与列大小相同,则得到的特征图大小为 4*4。
一次卷积只需要学习卷积核大小的参数个数,上课课件看到,从input image 到feature map 只需要学习4个参数 (W1,W2,W3,W4)
3. 池化层(pooling):筛选压缩的过程
Max pooling称为最大池化,即选区域内最大值
Average pooling 是选区域内的平均值
后续再更新...... 不懂为什么放图审核不过,只能写点简单一些的....
第一次学习深度学习,如有误请指出,谢谢!
0
收藏
请登录后评论