一篇文章搞懂CNN(卷积神经网络)及其所含概念

目录

  • 1. 什么是卷积神经网络:
  • 2. 应用领域:
  • 3. 架构:
  • 4. 卷积层的参数和名词
      • 参数:
      • 名词:
  • 5. 注意:
  • 6. 经典网络:
  • 小结:

在这里插入图片描述
当下,计算机视觉在人工智能领域中扮演着至关重要的角色。而卷积神经网络(Convolutional Neural Network,CNN)则是计算机视觉任务中最为常用且高效的模型之一。本文将介绍CNN的基本原理、架构和一些经典网络模型。并且解释上面这幅图。

1. 什么是卷积神经网络:

卷积神经网络 = 神经网络 + 其他层次

看到了吗,上图中只有绿色的部分是全连接神经网络,其余都是CNN加入的其他层次

2. 应用领域:

主要应用与计算机视觉领域(视频等于一张张图片)(一般用gpu(图像处理单元)比CPU快几百倍)

  1. 检测任务
  2. 分类与检索
  3. 超分辨率重构
  4. 人脸识别

3. 架构:

我们正式开始介绍CNN的架构,包括四个部分:

  1. 输入层

输入图像(h×w×c)

  1. 卷积层(CONV)
    在这里插入图片描述

新概念:

卷积核(filter W)(权重参数矩阵)

过程:

通道的每个像素点(起初是 图像颜色通道:RGB(R channel,G channel,B channel))与每个卷积核维度卷积(与卷积核内积)后得到一个特征值

对每个颜色通道都要做卷积(这三个卷积核可以不一样),算完之后这三个通道结果加起来再加上偏置b,得到一个特征图(可以用多个卷积核卷积得到多个特征图)

总结就是:卷积核把箱子拍扁成一个一维度的更小的纸(等于 内积之和+偏置)

  1. 池化层(POOL)(压缩、下采样)
    在这里插入图片描述

池化方法:

最大池化(MAX POOLING):提取最大值代替

不改特征图个数c,只缩减高h和宽w

  1. 全连接层(FC)

全连接开始前 卷积、激活函数(非线性变换 激活函数 RELU)、池化 循环使用,把最后结果拉成一条特征向量后交给全连接层

全连接层结构在这里就不多赘述了

4. 卷积层的参数和名词

参数:

  1. 边缘填充(pad):在最外层添加一圈数字(一般是0,因为0×任何数字都是0,防止干扰数据)从而防止对边缘的计算过少
  2. 卷积核个数:有多少个则得到多少个特征值
  3. 步长(S):卷积核移动的步长

卷积结果计算公式:
在这里插入图片描述

如果输入数据是32*32*3的图像,用10个5*5*3的filter来进行卷积操作指定步长为1,边界填充为2,最终输入的规模为?
(32-5+22)/1+1=32,所以输出规模为3232*10经过卷积操作后也可以保持特征图长度、宽度不变。

名词:

在这里插入图片描述

感受野:卷积后的一个像素点是由原来多少个像素计算得到的(比如上图的感受野就是3*3)

5. 注意:

带参数计算的(有w和b的、要根据设定更新东西的)层叫做一层,只有卷积层和全连接层被叫做层
堆叠小的卷积核比用一个大的卷积核需要的参数少(可以自己计算)

6. 经典网络:

在计算机视觉领域,有几个经典的CNN模型:

AlexNet:是2012年ImageNet竞赛的冠军,它引入了深度学习在计算机视觉中的重要性,并采用了多层卷积和全连接层的架构。

VGG:由牛津大学的研究团队提出,其特点是网络结构非常深,使用了连续的小卷积核进行卷积操作,参数量较大。

ResNet:引入了残差连接的思想,解决了深层网络训练中的梯度消失和梯度爆炸问题,使得网络可以更深。

小结:

关注我给大家分享更多有趣的知识,以下是个人公众号,提供 ||代码兼职|| ||代码问题求解||
由于本号流量还不足以发表推广,搜我的公众号即可:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/452420.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[word] word中如何打出下横线 #其他#其他#其他

word中如何打出下横线 1、电脑打开word文档。 2、打开进入word文档后,在正文处点击鼠标右键,然后选择字体选项。 3、进入字体选项页面后,点击效果中的删除线然后点击界面下方的确定选项。 4、选择删除线之后,返回word正文处一直…

【蓝桥杯选拔赛真题64】python数字塔 第十五届青少年组蓝桥杯python 选拔赛比赛真题解析

python数字塔 第十五届蓝桥杯青少年组python比赛选拔赛真题 一、题目要求 (注:input()输入函数的括号中不允许添加任何信息) 提示信息: 数字塔是由 N 行数堆积而成,最顶层只有一个数,次顶层两个数,以此类推。相邻层之间的数用线连接,下一层的每个数与它上一层左上…

网工内推 | 金融业网络安全岗,最高40K*15薪,CISP认证优先

01 国泰产险 招聘岗位:资深信息安全工程师 职责描述: 1、负责公司云平台业务系统的安全规划设计,协助业务系统制定安全解决方案; 2、负责建立公司信息安全标准,制定平台安全策略,安全加固,防范…

【leetcode题解C++】450.删除二叉搜索树中的节点 and 669.修剪二叉搜索树 and 108.将有序数组转换为二叉搜索树

450. 删除二叉搜索树中的节点 给定一个二叉搜索树的根节点 root 和一个值 key,删除二叉搜索树中的 key 对应的节点,并保证二叉搜索树的性质不变。返回二叉搜索树(有可能被更新)的根节点的引用。 一般来说,删除节点可…

Android学习之路(27) ProGuard,混淆,R8优化

前言 使用java编写的源代码编译后生成了对于的class文件,但是class文件是一个非常标准的文件,市面上很多软件都可以对class文件进行反编译,为了我们app的安全性,就需要使用到Android代码混淆这一功能。 针对 Java 的混淆&#x…

力扣383周赛第三题

本题的难点其实不在思路上,而是有些人遇到这种题就不想做了,题目太长,有点读不懂题。 只要先耐心下来把题读懂之后这题其实就没那么难了,读懂题之后还有一个关键点就是,我们怎么在1e8时间复杂度之内跑过呢&#xff1f…

问题:以下关于搜索OCPC说法错误的是()? #知识分享#知识分享#媒体

问题:以下关于搜索OCPC说法错误的是()? A.OCPC进入第二阶段,不能随意更换转化目标和页面 B.OCPC可以直接跳过第一阶段,直接开始跑第二阶段 C.开启OCPC计划后,系统就会…

Flink生产环境常见问题及解决方法

在Flink生产环境中,可能会遇到一些常见的问题。下面简单的介绍几个常见问题,并且提供一些解决方法,来帮助你更好地应对这些问题。 故障转移和高可用性 Flink提供了故障转移和高可用性机制,但在配置和使用时可能会遇到问题。如果…

Linux 网络编程 + 笔记

协议:一组规则 分层模型结构: OSI七层模型:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层TCP/IP 4层模型:链路层/网络接口层、网络层、传输层、应用层 应用层:http、ftp、nfs、ssh、telnet、传输层&am…

过年前想要便宜寄快递,究竟还有什么渠道呢?

马上就是年关了,心情显得异常激动了,想到马上就可以吃到团圆的年夜饭了,小编和大家都是非常的开心了,还有春节期间的旅游,探亲,都是值得期待的事情了,亲戚朋友,邻里邻居之间会互相送…

python 视频硬字幕去除 内嵌字幕去除工具vsr

项目简介 开源地址:https://github.com/YaoFANGUK/video-subtitle-remover Video-subtitle-remover (VSR) 是一款基于AI技术,将视频中的硬字幕去除的软件。 主要实现了以下功能: 无损分辨率将视频中的硬字幕去除,生成去除字幕后…

【Linux】信号-下

欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:题目解析 🌎推荐文章:【LeetCode】winter vacation training 目录 👉🏻信号递达,信号未决&#x…