CNN卷积详解（三）

一、卷积层的计算

4 $*$ 4的输入矩阵 $I$ 和 3 $*$ 3 的卷积核 $K$ :

在步长（stride）为 1 时，输出的大小为 ( 4 − 3 + 1 ) × ( 4 − 3 + 1)

计算公式：
● 输入图片矩阵 $I$ 大小： $w \times w$
● 卷积核 $K$ ： $k \times k$
● 步长 $S$ ： $s$
● 填充大小（padding）： $p$

$\frac{(w − k + 2p )}{s}+1$

输出图片大小为： $o \times o$
● 步长为2，卷积核为33，p=0的卷积情况如下：

当卷积函数中padding='same’时，会动态调整 $p$ 值，确保 $o = w$ ，即保证输入与输出一致。例如：输入是 28281 输出也为 28281 。
● 步长为1，卷积核为33，padding='same’的卷积情况如下：

在这里插入图片描述

🔍实例：
$7 * 7$ 的 input， $3 * 3$ 的 kernel，无填充（padding=0），步长为1，则 $\frac{(7 − 3 )}{1}+1$ 也即 output size 为 $5 * 5$
在这里插入图片描述
$7 * 7$ 的 input， $3 * 3$ 的 kernel，无填充（padding=0），步长为2，则 $\frac{(7 − 3 )}{2}+1$ 也即 output size 为 $3 * 3$

二、卷积层运算量的计算

在这里插入图片描述
对于第一个卷积过程涉及的计算量计算过程如下：

首先，我们需要计算卷积层的参数量。对于一个卷积核大小为 $\times k$ ，输入特征图大小为 $\times w \times c_{in}$ ，输出特征图大小为 $\times w' \times c_{out}$ 的卷积层，其参数量为：

𝑃𝑎𝑟𝑎𝑚 = $k^2 \times c_{in} \times c_{out}$ + $c_{out}$

其中最后的 $c_{out}$ 是bias的数量

引自： [假设卷积核的大小为 k*k, 输入channel为M，输出channel为N。]
（1）bias为True时：参数数量为： $k \times k \times M \times N + N$ （bias的数量与输出channel的数量是一样的）

（2）bias为False时：参数数量为： $k \times k \times M \times N$

（3）当使用BN时，还有两个可学习的参数α和β，参数量均为N 则参数数量为： $k \times k \times M \times N + 3 \times N$

对于本题，输入特征图大小为 $100 \times 100 \times 128$ ，输出特征图大小为 $100 \times 100 \times 256$ ，卷积核大小为 $\times 5$ ，且填充为 2，步长为 1，输出通道数为 256。因此，每个卷积层的参数量为：

𝑃𝑎𝑟𝑎𝑚 = $5^2 \times 128 \times 256$ + 256 ≈ $8.192 \times 10^5$

参数量会计算了，那么 $F L OP s$ 其实也是很简单的，就一个公式：

$FLOPs_{total}$ = 𝑃𝑎𝑟𝑎𝑚 $\times h' \times w'$ = $8.192 \times 10^5 \times 100 \times 100$ = $8.192 \times 10^9$

因此，经过具有 256 个输出的 5x5 卷积层之后，输出数据为 100x100x256 的计算量是约为 $8.192 \times 10^{9} FLOPs$ 。

对于第二个卷积过程涉及的计算量计算过程如下：

首先考虑 1x1 卷积层的计算量。套用上面的公式，输入特征图大小为 $100 \times 100 \times 128$ ，输出通道数为 32，因此经过 1x1 卷积层后，输出特征图大小为 $100 \times 100 \times 32$ ，这里的bias值很小我直接省了，计算量为：

$FLOPs_{1\times1}$ = $1^2 \times 128 \times 32 \times 100 \times 100 = 4.096 \times 10^7$

接下来考虑 5x5 卷积层的计算量，经过 1x1 卷积层后，输出特征图大小为 $100 \times 100 \times 32$ ，输入通道数为 32，输出通道数为 256，卷积核大小为 5x5，填充为 2，步长为 1，这里的bias值很小我直接省了，计算量为：

$FLOPs_{5\times5}$ = $5^2 \times 32 \times 256 \times 100 \times 100= 2.048 \times 10^{9}$

因此，经过具有 32 个 1x1大小的卷积核的卷积层和具有 256 个5x5大小的卷积核的卷积层之后，输出数据为 100x100x256 的计算量为

$FLOPs_{1\times1} + FLOPs_{5\times5}$ ≈ $2.048 \times 10^{9}$

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/76231.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

CNN卷积详解（三）

一、卷积层的计算

二、卷积层运算量的计算

相关文章

CSS自学框架之动画

在ubuntu+cpolar+rabbitMQ环境下，实现mq服务端远程访问

8.4.tensorRT高级(3)封装系列-infer推理封装，输入输出tensor的关联

【LeetCode】剑指 Offer Ⅱ 第4章：链表（9道题） -- Java Version

基于 Debian 12 的MX Linux 23 正式发布！

基于YOLOv8模型和PCB电子线路板缺陷目标检测系统（PyTorch+Pyside6+YOLOv8模型）

调频连续波（FMCW）波形设计、真实道路场景仿真及汽车自适应巡航控制信号处理（Matlab代码实现）

1、攻防世界第一天

信号处理--基于EEG脑电信号的眼睛状态的分析

【大虾送书第六期】搞懂大模型的智能基因，RLHF系统设计关键问答

71 # 协商缓存的配置：通过内容

算法leetcode｜72. 编辑距离（rust重拳出击）