0%

经典卷积网络简介

LeNet-5

LeNet-5可以识别手写体数字,针对灰度图像训练,所以$n_c^{[0]}=1$

该模型成文于1998年,所以池化层采用了当时常用的平均池化,同时采用的非线性函数也非如今常用的ReLU($f(x)=max(0,x)$),而是Sigmoid和Tanh函数

AlexNet

AlexNet比起LeNet模型更复杂,同时参数更多。LeNet大约有$6*10^4$个参数,而AlexNet则有$6*10^7$个参数。但由于AlexNet采用的是ReLU激活函数,同时网络的规模很大,故它在计算机视觉领域的应用很广泛。

VGG-16

VGG-16的模型很规整,首先全部采用$3*3,s=1$的过滤器做same卷积,同时最大池化层的超级参数均为$2*2,s=2$。整个网络依次由多个卷积层和一个池化层交替连接,每组卷积让特征图的通道加深一倍,池化让特征图的长宽减小一半,这种规律性让网络的结构变得相对一致。VGG-16中含有$1.38*10^8$个参数,16代表了一共使用了16个卷积层和全连接层,VGG-19比VGG-16的参数更多,但效果接近,所以VGG-16的使用更为广泛。