卷积神经网络通俗理解

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

时间女神发布于2022-08

本文将从以下几个方面来理解卷积神经网络。

1、为什么对于图像要用卷积神经网络
有些模式要比整张图像要小的多，如下的帽子特征。一个神经元不需要看整张图像就可以发现这种模式，这可以让我们模型只用更少的参数将小部分区域联系起来组成一个模式。

在图像不同的区域出现同样的特征，使得我们只需要使用同样的参数就能用来判定两张图像。如下两图，我们只用一个来捕捉帽子特征的卷积核就能对胡桃与伊蕾娜进行区分。

在卷积网络中经常用到的下采样，并不会影响图像的整体内容（分类而言损失不大）。因此，我们可以下采样来缩小图像输入，从而减小模型在处理图像时产生的内存开销。

2、CNN做图像识别的整体架构
如下是我们用于图像分类的一般卷积神经网络架构。首先我们对输入图像做卷积，做最大池化降低分辨率，重复这个模块多次来提取图像的高级特征；然后我们将提取的特征展平好之后，连接全连接神经网络；最后使用softmax进行分类。

3、Convolution卷积
如下图所示，我们网络要学习的就是每个卷积核里面的参数，每个卷积核都是一个张量，它的通道数一定要与输入的通道数一致。卷积操作就是对应元素相乘然后再相加得到一个位置的结果。

下图右边是我们采用步幅为1，无填充卷积得到的一个特征图。我们的卷积核检测到了左上到右下的斜线模式，斜线出现的位置，都会产生较大激活值3。

我们的卷积核设置的越多，输出的特征图的通道数也会越多，提取到的特征也就多一些。

4、Maxpooling最大池化
以我们上面的图像为例，两个卷积核卷积得到的特征分别如下。

我们使用大小2x2，步幅也为2的最大池化。即对于每个2x2的区域，我们取其中的最大值作为输出，然后在滑动2步取下一个2x2区域的最大值。我们可以得到如下结果。

5、Flatten展平
最后是展平接全连接层，这样就完成了整个使用卷积进行图像识别的任务。

0

收藏

回复