卷积神经网络学习笔记
分类
卷积层+激活层+池化层的组合多次出现 提取特征值
多个全连接 或 特殊的CNN结构 作为输出层 作分类器、检测器、分割器
计算机视觉主要任务左图展示了四种主要的计算机视觉任务(由粗粒度到精细粒度)
1、图像分类(what)为图像赋予一个或多个语义标签
2、目标检测(what & where )找到图像中物体的类别及所在位置
3、图像语义分割(what & where )找到图像中物体的类别并精确勾勒出其所在位置
4、图像实例分割(what & where )多个同类物体存在时,将它们一一区分出来
数据集
1.fifar数据集
http://www.cs.toronto.edu/~kriz/cifar.html
60000张32*32 的RGB图像
10个互斥的类别,每类6000张图片
训练:50000张,5个训练批,每批10000张每类图像随机抽取,张数不平均ü测试:
10000张,单独构成一批,每类1000张
2.ImageNet数据集
http://image-net.org
训练集:1,281,167张图片+标签
验证集:50,000张图片+标签
测试集:100,000张图片1000个类别,每个类别1000多张图像
经典CNN结构探索
AlexNet
VGG
GoogLeNet/Inception
ResNet
VGG
牛津大学视觉几何计算组
深度增加& 小卷积核->对网络最后的分类识别效果有很大作用
小卷积核:3*3:表示上下、左右、中心这些概念的最小卷积核尺寸
深度:AlexNet 8 层àVGG最深19层
请登录后评论
TOP
切换版块
赞一个