【AI达人养成营】关于卷积神经网络的基础概念

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

M Mia_ni_ming 发布于2021-12

在学习卷积神经网络之前先了解下线性网络：

一般线性方程为 Y=Kx+b ，K是固定不变的，b是偏置。

在卷积网络中见到最多的表达式为：f=Wx+b，其中X是定的，变动W即可。

卷积神经网络（CNN）可用于特征提取，其包含：输入层，卷积层，池化层，全连接层。

现在分别介绍下每个流程：

1.输入层(input)：

在图像处理中，输入的数据不是一张肉眼所见的一张彩色图面，而是要将图面转化为矩阵的形式进行输入。例如一张32*32彩色图片由RGB构成，有3个通道。因此输入的数据为32*32*3，其中32*32为图片的矩阵形式。

2.卷积层（conv）：

卷积做了什么：将RGB通道分别拆开进行处理（卷积），再整合一起。

卷积核是经过多次计算出来的，卷积核与输入图像进行卷积可得到所要提取的特征。

卷积的过程就是图中橙色部分与卷积核进行一个对应位置相乘，再将得到的结果进行相加，

特征图(feature map)：卷积一次后得到的结果。

对于一张彩色图片，其含3个通道，那么卷积核也可以有3个与其对应相乘。

卷积结果计算：

在图中可以看到，特征图大小与输入图像及卷积核相关。图中的例子，输入图像为6*6的矩阵，卷积核为3*3，步长为1，则特征图大小为： , 行与列大小相同，则得到的特征图大小为 4*4。

一次卷积只需要学习卷积核大小的参数个数，上课课件看到，从input image 到feature map 只需要学习4个参数 (W1,W2,W3,W4)

3. 池化层(pooling)：筛选压缩的过程

Max pooling称为最大池化，即选区域内最大值

Average pooling 是选区域内的平均值

后续再更新...... 不懂为什么放图审核不过，只能写点简单一些的....

第一次学习深度学习，如有误请指出，谢谢！

0

收藏

回复