深度学习经典网络模型

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

SK_qinghe 发布于2021-09

1、LeNet：LeNet-5由Yann LeCun等人在1998年提出的一种卷积神经网络，在当时被广泛应用于字符数据识别和手写字符识别。网络主要由卷积层、池化层和全连接层组成，共8层；

2、AlexNet:2012年ImageNet大规模图像识别竞赛上提出的一个网络模型，曾经以top-5错误率15.3%的成绩获得第一名，错误率相比于上一年的冠军下降了十个百分点。网络整体分为上下两部分（两个GPU），共包含8层。其中卷积层、最大池化和ReLU层为前五层，全连接层和dropout层为后面三层；

3、VGGNet:是牛津大学机器视觉实验室和DeepMind公司合作研究出的一种深度卷积网络，曾经于2014年在ILSVRC比赛上取得了分类任务的第二名和定位任务的第一名。网络模型共包含6种不同的网络结构，每种结构都有包含了5类卷积操作，每类卷积操作均使用3*3卷积核，每类卷积后使用一个窗口为2*2的最大池化进行操作，接下来是3个全连接层，最好输出分类结构。

4、ResNet：由微软亚洲研究院的Kaiming He等人提出，曾经在ImageNet比赛分类任务中获得第一名。由于VGGNet网络模型在19层之后再增加网络层数就会出现分类性能下降和梯度消失等问题，而ResNet网络通过残差网络结构进行残差学习，能够消除VGGNet所产生的梯度消失和信息丢失等状况。

5、GoogLeNet：因其核心结构Inception,曾经在2014的ILSVRC竞赛1上取得最好的成绩。Inception是一种具有优良局部拓扑结构的网络，能够对输入图像并行的执行多个卷积操作或池化操作后，再将所有的输出结果组合成一个特征图。使用不同大小的卷积核获取不同的感受野，使用concat将不同尺度的特征进行融合。其中1*1卷积主要是为了降维，来减少计算量。

Inception V1——构建了1x1、3x3、5x5的 conv 和3x3的 pooling 的分支网络module，同时使用MLPConv和全局平均池化，扩宽卷积层网络宽度，增加了网络对尺度的适应性；
Inception V2——提出了Batch Normalization，代替Dropout和LRN，其正则化的效果让大型卷积网络的训练速度加快很多倍，同时收敛后的分类准确率也可以得到大幅提高，同时借鉴VGGNet使用两个3x3的卷积核代替5x5的卷积核，在降低参数量同时提高网络学习能力，以及保证感受野不变；
Inception V3——引入了 Factorization，将3x3卷积拆成1x3卷积和3x1卷积，一方面节约了大量参数，加速运算并减轻了过拟合，同时增加了一层非线性扩展模型表达能力，除了在 Inception Module 中使用分支，还在分支中使用了分支（Network In Network In Network）；
Inception V4——结合 ResNet 可以极大地加速训练，同时极大提升性能。