计算机视觉:深度学习之卷积神经网络CNN-1
1、普通神经网络
普通神经网络每层由多个神经元组成,
每个神经元完全连接到前一层中的所有神经元和后一层中的所有神经元。

2、卷积神经网络
卷积神经网络每层由d个特征图组成,
每个特征图上包含w*h个神经元,
层间的神经元通过共享权重的方式连接。

3、卷积神经网络的组成
卷积神经网络一般由输入层、卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层及输出层组成;
卷积神经网络的典型结构如下;
流程:
输入图像经过卷积层提取特征,然后经过池化层进行下采样,之后再由卷积层提取特征,再经过一次池化层下采样,最后将特征图与全连接层进行全连接操作,输出层输出。

4、卷积层
卷积时卷积神经网络的核心内容,功能是提取特征;
卷积核是提取特征的基本单位,卷积核与上一层的局部感受野相连接,局部感受野是神经网络的一个重要特性。
【近似真理】:在图像中,局部的像素联系较为紧密,而相距较远的像素关联性不大;
因此神经元不必与上一层的每个神经元相连接,只需要对局部进行感知,然后把所有局部特征整合起来就得到了全局特征。
权值共享方式连接,能有效的减少参数的数量;
卷积核在图像中某一位置提取的特征在其他位置也适用,在提取某种特征是只需相同的卷积核即可,使其在图像中进行滑动即可得整张特征图。

5、池化层
池化层是非线性下采样的一种形式,
池化层通常插入到连接的卷积层之间,能够减小特征表示的空间大小,且减少了网络参数的数量和计算量;
池化层形式:
常用的最大值池化(Max Pooling)、均值池化(Average Pooling);
将每张特征图分成单独的块,在块上使用非线性函数如max pooling取最大值;

6、应用:目标检测
目标检测也即物体识别与定位,
包含两个任务:
①找出场景中的物体,给出物体的包围盒(bounding box)信息;
②根据找出来的物体,识别该物体的类型。
其可以分为以下几个阶段:
