CNN（Convolutional neural network）卷积神经网络入门介绍＆编码测试

617yx

CS Ph.D. STUDENT

CNN神经网络

产生背景：

从传统全连接的神经网络发展而来，在 CNN 出现之前，图像对于人工智能来说是一个难题，有2个原因：

图像需要处理的数据量太大，导致成本很高，效率很低
图像在数字化的过程中很难保留原有的特征，导致图像处理的准确率不高

https://easyai.tech/ai-definition/cnn/#zuoyong

定义及介绍；

经典CNN由三部分组成：卷积层、池化层、全连接层。

全连接层和前馈神经网络中的一致，而卷积和池化则是应用了图像处理相关的先验知识（平移不变性带来的权值共享，降维）之后对全连接做了一定改进的连接层。

卷积层：特征提取。

池化层：特征过滤，降维，去冗余，权衡计算性能。

适用的场景或问题/与其他网络的差异

引入了很多图像处理的先验知识，天生适合做图像处理问题。

应用有：图像处理问题（图像分类、目标检测、目标分割、人脸识别、骨骼识别）

经典网络：

LeNet：第一个成功的卷积神经网络应用

AlexNet：类似LeNet，但更深更大。使用了层叠的卷积层来抓取特征（通常是一个卷积层马上一个max pooling层）

ZF Net：增加了中间卷积层的尺寸，让第一层的stride和filter size更小。

GoogLeNet：减少parameters数量，最后一层用max pooling层代替了全连接层，更重要的是Inception-v4模块的使用。

VGGNet：只使用3x3 卷积层和2x2 pooling层从头到尾堆叠。

ResNet：引入了跨层连接和batch normalization。

DenseNet：将跨层连接从头进行到尾。

优势

卷积层中的共享权值、卷积操作体现了图像处理的感受野和平移不变性的先验知识，降低了需要训练的参数。
池化可以说是卷积的近似，节省了计算的开销，通过一些池化策略能够使得特征图的主要特征更直接地暴露出来，也可以说是去冗余。

不足与改进

池化在获得计算性能的提升时，会带来一定程度上特征的丢失，对一些需要临近特征来判别的概念，池化层的filter size设置很重要。
针对尺寸不变形（一个东西，放大缩小后的判别等价性），Inception策略让网络自己选择卷积核size来获得最好的性能。
一些概念的判断是根据一些small features和 big features组合所判断的，ResNet使用了跳层连接的方式，提高了各层抓取概念的可重用性。

编码测试

输入编码格式与输出编码格式

Ｘ：输入是一张黑白的手写数字图片的像素张量，形状为２８＊２８，数据类型为numpy.ndarray。

Ｙ：输出是对应图片在十个类别的判别结果的one-hot张量，形状为１０＊１０，数据类型为numpy.ndarray。

网络结构（配图）

所用的激活函数

如图所示，卷积１,2和dense1都用了ＲＥＬＵ，在dense２(输出层)使用了softmax激活。

伪代码

# load data 
# split the data 
# init sequential model
# add layer:Conv2D-1
# add layer:Conv2D-2
# add layer:MaxPooling2D
# add Flatten
# add layer:Dense1
# add Dropout
# add layer:Dense2
# complie
# training...
# test

Git链接

https://github.com/liuyixin-louis/dl_learning/blob/master/CNN.ipynb

参考的网上资料的链接

https://github.com/keras-team/keras/tree/master/examples

更换参数或改变结构的相关测试

调参dropout_possibility

尝试网格调dropout_possibility这个参数，但是几次最好的结果都不太一样，应该是还受到了随机初始化时的影响，可以看出改进这个参数应该效果不是很明显。

另外，最好的dropout概率也都比较小，可能是问题比较简单所导致的。

个人感悟

各种技巧都是应对概念判别的不变性所做的调整，可以从不变性和概念判别入门改进网络。

问题

跳层的出发点是我们判断概念有时是根据一些小fetures的组合，那么具体跳层是传的什么？过滤器还是特征图？应该是特征图。特征图会不会出现sclae不一致导致的无法做卷积？应该不会吧，有padding，可以保证特征图尺寸一致不变。
跳层的特征图如何做空间上的对应？会不会Ａ处的特征和Ｂ处特征（和Ａ隔得比较远）匹配上了？

参考/材料

quick start cnn:

https://zhuanlan.zhihu.com/p/32299939

https://www.zhihu.com/question/52668301

what is polling?

https://www.zhihu.com/question/36686900

发布于 2020-04-01 13:22

卷积神经网络（CNN）

深度学习（Deep Learning）

神经网络

CNN（Convolutional neural network）卷积神经网络入门介绍＆编码测试

CNN神经网络

编码测试

问题

参考/材料

文章被以下专栏收录

机器学习与人工智能