首页 PaddleCV 帖子详情
深度学习经典网络模型
收藏
快速回复
PaddleCV 文章语义分割目标检测图像分类 2258 5
深度学习经典网络模型
收藏
快速回复
PaddleCV 文章语义分割目标检测图像分类 2258 5

1、LeNet:LeNet-5由Yann LeCun等人在1998年提出的一种卷积神经网络,在当时被广泛应用于字符数据识别和手写字符识别。网络主要由卷积层、池化层和全连接层组成,共8层;

2、AlexNet:2012年ImageNet大规模图像识别竞赛上提出的一个网络模型,曾经以top-5错误率15.3%的成绩获得第一名,错误率相比于上一年的冠军下降了十个百分点。网络整体分为上下两部分(两个GPU),共包含8层。其中卷积层、最大池化和ReLU层为前五层,全连接层和dropout层为后面三层;

3、VGGNet:是牛津大学机器视觉实验室和DeepMind公司合作研究出的一种深度卷积网络,曾经于2014年在ILSVRC比赛上取得了分类任务的第二名和定位任务的第一名。网络模型共包含6种不同的网络结构,每种结构都有包含了5类卷积操作,每类卷积操作均使用3*3卷积核,每类卷积后使用一个窗口为2*2的最大池化进行操作,接下来是3个全连接层,最好输出分类结构。

4、ResNet:由微软亚洲研究院的Kaiming He等人提出,曾经在ImageNet比赛分类任务中获得第一名。由于VGGNet网络模型在19层之后再增加网络层数就会出现分类性能下降和梯度消失等问题,而ResNet网络通过残差网络结构进行残差学习,能够消除VGGNet所产生的梯度消失和信息丢失等状况。

5、GoogLeNet:因其核心结构Inception,曾经在2014的ILSVRC竞赛1上取得最好的成绩。Inception是一种具有优良局部拓扑结构的网络,能够对输入图像并行的执行多个卷积操作或池化操作后,再将所有的输出结果组合成一个特征图。使用不同大小的卷积核获取不同的感受野,使用concat将不同尺度的特征进行融合。其中1*1卷积主要是为了降维,来减少计算量。

Inception V1——构建了1x1、3x3、5x5的 conv 和3x3的 pooling 的分支网络module,同时使用MLPConv和全局平均池化,扩宽卷积层网络宽度,增加了网络对尺度的适应性;
Inception V2——提出了Batch Normalization,代替Dropout和LRN,其正则化的效果让大型卷积网络的训练速度加快很多倍,同时收敛后的分类准确率也可以得到大幅提高,同时借鉴VGGNet使用两个3x3的卷积核代替5x5的卷积核,在降低参数量同时提高网络学习能力,以及保证感受野不变;
Inception V3——引入了 Factorization,将3x3卷积拆成1x3卷积和3x1卷积,一方面节约了大量参数,加速运算并减轻了过拟合,同时增加了一层非线性扩展模型表达能力,除了在 Inception Module 中使用分支,还在分支中使用了分支(Network In Network In Network);
Inception V4——结合 ResNet 可以极大地加速训练,同时极大提升性能。

 

 

0
收藏
回复
全部评论(5)
时间顺序
A
AIStudio3892040
#2 回复于2021-09

0
回复
A
AIStudio3892040
#3 回复于2021-09

赞!

0
回复
李长安
#4 回复于2021-12

最后拿了哪里的offer?

 

0
回复
DeepGeGe
#5 回复于2021-12

关于这些经典的CNN,我全部手动地做了复现,链接在这里:https://blog.csdn.net/qq_24178985/category_11149077.html

0
回复
退后是人生
#6 回复于2021-12

有心了

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户