本站会放置Google广告用于维持域名以及网站服务器费用。
工资「喂饱肚子」，副业「养活灵魂」！
如果觉得本站的内容有帮助，可以考虑打赏博主哦！
欢迎大家交换友链，可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请！
计算机图形学与计算几何经典必备书单整理，下载链接可参考：https://www.stubbornhuang.com/1256/
在本站开通年度VIP，无限制下载本站资源和阅读本站文章
本站由于前段时间遭受到大量临时和国外邮箱注册，所以对可注册的邮箱类型进行了限制！
感谢大家访问本站，希望本站的内容可以帮助到大家！
问题反馈可发送邮件到stubbornhuang@qq.com

当前位置：首页 › AI › 深度学习 › 正文

深度学习 – CNN中卷积层、池化层、全连接层的输出参数大小的计算

StubbornHuang 深度学习发布于2022-06-09 阅读 2,799次 0次评论 1次点赞本文共2170个字，阅读需要6分钟。

CNN(Convolutional Neural Networks，卷积神经网络)，CNN在图像、提取空间信息中有着广泛的应用，CNN通常包含以下几种神经层：

卷积层 Convolutional layer
池化层 Pooling layer
全连接层 Fully-Connected layer
线性整流层 Rectified Liner Units layer

一般通过堆叠上述神经层组成CNN网络，在本文中将以清晰的示例说明如何计算不同神经层的输出参数大小。

本文将以最简单的猫狗图片分类作为说明示例，假设有一张有RGB 3个颜色通道，宽32，高32的图片，我们通过将其输入到CNN中对该图片进行分类，判断是猫还是狗。

1 卷积层的输出

卷积层是构成CNN网络的核心，其基本上完成了大量繁重的计算工作。一般有以下参数影响卷积层的输出：

filter num：卷积核的数量
filter size：卷积核的大小
stride：卷积的步长
padding：卷积的填充

对于卷积层的计算，假设卷积层输入为 $W_{input}\times H_{input} \times D_{input}$ ，其中 $W_{input}$ 为输入的宽度， $H_{input}$ 为输入的高度， $D_{input}$ 为输入的维度（通道数），经过卷积核数量为 $K$ ，卷积核大小为 $F$ ，卷积步长为 $S$ ，卷积填充为 $P$ 的卷积层，则该卷积层的输出为，

在没有padding的情况下

\begin{array}{c} W_{output} = \frac{W_{input}-F}{S} + 1\\ H_{output} = \frac{H_{input}-F}{S} + 1\\ D_{output} = K \end{array}

在有padding的情况下

\begin{array}{c} W_{output} = \frac{W_{input}-F+2P}{S} + 1\\ H_{output} = \frac{H_{input}-F+2P}{S} + 1\\ D_{output} = K \end{array}

假设CNN输入图片的维度为 $3\times 32\times 32$ ，其中通道数为3，宽为32，高为32，假设CNN第一个卷积层卷积核数量为10，卷积核大小为 $3\times 3$ ，卷积步长为2，卷积填充为0，则该卷积层输出大小为

\begin{array}{c} W = \frac{32-3+0}{2} + 1 = 15\\ H = \frac{32-3+0}{2} + 1 = 15\\ D = 10 \end{array}

2 池化层的输出

增加池化层的目的主要是下采样（downsamples）。
在CNN中，在连续的卷积层中增加一个池化层可以逐渐减小表示的空间大小，从而减少网络中参数数量和计算量，并且能够在一定程度上防止过拟合。

最常见的池化层规模为 $2 \times 2$ ，在输入的每个深度切片沿宽度和高度进行下采样。

在进行池化时，通常不使用任何填充，所以padding通常为0。

对于池化层的计算，假设输入层为 $W_{input}\times H_{input} \times D_{input}$ ，其中 $W_{input}$ 为输入的宽度， $H_{input}$ 为输入的高度， $D_{input}$ 为输入的维度（通道数），经过过滤器数量为 $K$ ，池化大小为 $F$ ，步长为 $S$ 的池化层，则该池化层的输出为，