卷积神经网络(CNN)笔记——多图深入理解

梗直哥、梗直哥丶的个人空间-梗直哥丶个人主页-哔哩哔哩视频
 

过去十年,卷积神经网络(CNN)如同科技领域的明星,以其卓越的表现撑起了人工智能的半边天。这种创新的网络模型,不仅在计算机视觉、语音识别等传统领域大放异彩,更为人工智能的快速发展和广泛应用奠定了坚实的基础。

我们先来看看CNN的内部构造。从表面上看,神经网络就像一个黑盒子,我们无法完全看清其内在的运作机制。但不同的神经网络架构,实际上反映了内部构造的不同,就像不同的机器引擎一样,决定了它们的性能表现。

一个典型的CNN由输入层、隐藏层(包括卷积层、池化层)和输出层组成。输入层接收原始数据,如图像像素矩阵;输出层给出最终的预测或分类结果;而隐藏层则负责对输入数据进行特征提取和转换,是CNN的核心所在

ab8d25ae5fee4962848b53f1deb23988.png

1.为什么用卷积层

这个设计灵感来自计算机科学家对数学和生理学的研究。他们发现,生物神经元在接受感知信息时,会对局部区域的刺激产生响应,这种局部感知特性恰好与卷积操作相吻合。

随着算力的发展成熟,卷积操作终于可以在大规模数据上展现其优势。CNN的训练过程,实际上就是不断喂入数据样本,根据损失函数调整神经网络中每个节点的权重,使得模型可以更准确地拟合训练数据。

早期的全连接神经网络就像一个"大胖子",每层节点都与上一层所有节点相连,造成了巨大的计算冗余和参数过多的问题,难以高效训练。而卷积层的本质,就是给神经网络"减肥"——它只与输入数据的局部区域相连,极大降低了参数量,简洁高效。

d90539666a4d4b5ba750d0c0cac319eb.png

同时,随着网络层数的增加,每个神经元的感受野(即感知范围)也在逐层扩大,使得CNN可以逐步捕捉到输入数据中的更高层次特征。

2c530049ed824f2eb25403d29c7b44d4.png

以图像识别为例,浅层可能只能识别边缘和纹理等低级特征,而深层就能识别物体的轮廓、局部和整体形状等高级语义信息。

be6021a9c91d48efae776423f460781a.png

在卷积神经网络中,卷积层并不是简单地对输入数据进行卷积操作,还需要引入非线性激活函数,以增加网络的表达能力。

激活函数的作用是对卷积的线性输出结果进行非线性变换,使神经网络能够学习到更加复杂的映射关系。常见的激活函数包括Sigmoid函数、Tanh函数等,它们可以将输入压缩到一个较小的范围内。

然而,这些传统激活函数在深层网络中容易出现梯度消失的问题,导致收敛缓慢。为了解决这个问题,线性整流单元(ReLU)应运而生。

ReLU激活函数的计算公式非常简单:f(x)=max(0,x),也就是说,大于0的输入保持不变,小于0的输入则被直接置为0。

1cb424c9760649cbb95e220ccb95618f.png

2.池化层干什么的

池化层相当于对特征图进行"汇聚"操作,抓住局部区域的主要特征,忽略次要的细节差异。

具体来说,池化层会在特征图上滑动一个小窗口,对窗口内的多个神经元输出进行统计,组合成单个下层神经元的输入。常见的池化方式包括最大池化(Max Pooling)和平均池化(Average Pooling)。

095be27247c345488bdf1bdb8bdee90e.png

以最大池化为例,它会在滑动窗口内找到最大的神经元激活值作为输出。这种操作可以保留局部区域内最显著的特征响应,达到"抓主要矛盾"的目的。通过这样的汇聚和压缩,池化层可以进一步放大特征的响应强度,增强特征的鲁棒性,使得神经网络对几个像素的细微差异不那么敏感。

除了提取主要特征外,池化层还可以降低特征图的维度,减少网络的参数量和计算复杂度。这不仅能够大幅提高训练和预测的效率,更重要的是,池化层通过降低维度,增加了网络的泛化能力,一定程度上缓解了过拟合问题。

3.全连接层的妙用

在卷积神经网络的结构中,全连接层扮演着整合和决策的关键角色。它会将来自前面所有卷积层和池化层的特征信息进行融合,把这些分布式的特征表示集中到一个全连接的网络层中。

具体来说,全连接层会将相邻的两层全部节点之间进行交叉连接,每个节点与上一层的所有节点相连。通过这种密集的连接方式,全连接层可以将之前层提取的所有局部特征整合起来,建立更加全面的特征表示。

在分类或回归任务中,全连接层的输出就是神经网络的最终结论。之所以称为"全连接",就是要确保模型能够充分利用来自各层的所有特征信息,从而产生更加准确和鲁棒的预测结果。因此,全连接层被视为卷积神经网络的"大脑",起着整合和决策的关键作用。

9e1788e306c84793b5635bca70c98979.png

与之相对,卷积层和池化层则主要负责多尺度特征的提取。卷积层通过滑动卷积核在输入数据上进行局部扫描,能够有效捕捉数据的局部模式和结构信息,例如图像的边缘、纹理、形状等低级特征。而池化层则通过下采样操作,对卷积层提取的局部特征进行归纳和压缩,保留主要特征信息的同时降低了特征维度。这种操作不仅提高了特征的鲁棒性,还增强了网络的泛化能力。

通过多层次的卷积和池化操作,神经网络逐层从低级到高级,从小尺度到大尺度地提取特征。从边缘->纹理->局部形状->整体轮廓,这种层层递进的特征提取过程,使得神经网络最终能够获得对输入数据的多尺度、多层次的表示。

4.总结

卷积神经网络是一种精心设计的神经网络架构,内部结构精妙高效,赋予了它强大的特征提取和表达能力。作为推动人工智能飞速发展的重要力量,CNN无疑是深度学习领域最杰出、最广泛应用的模型之一。

通过对输入数据进行多层次的卷积和池化操作,CNN可以从低级到高级、从小尺度到大尺度地逐步提取特征。卷积层发挥了特征提取的核心作用,池化层起到降维和压缩特征的效果,而全连接层则负责将这些分布式特征整合,得出最终结论,完成分类、预测等任务。

只有深入理解CNN的内在机理和精巧设计,我们才能更好地利用这一强大工具,在图像识别、语音处理等领域施展拳脚,并将CNN的创新思路推而广之,开拓人工智能的新视野,探索更多前沿应用。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/616357.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day19-【Java SE进阶】网络编程

一、网络编程 1.概述 可以让设备中的程序与网络上其他设备中的程序进行数据交互(实现网络通信的)。java.net,*包下提供了网络编程的解决方案! 基本的通信架构 基本的通信架构有2种形式:CS架构(Client客户端/Server服务端)、BS架构(Browser浏览器/Server服务端)。 网络通信的…

【新版】系统架构设计师 - 知识点 - 结构化开发方法

个人总结,仅供参考,欢迎加好友一起讨论 文章目录 架构 - 知识点 - 结构化开发方法结构化开发方法结构化分析结构化设计 数据流图和数据字典模块内聚类型与耦合类型 架构 - 知识点 - 结构化开发方法 结构化开发方法 分析阶段 工具:数据流图、…

从0到1实现RPC | 12 限流

在服务提供者provider端添加限流逻辑 限流:指定时间内请求数超过指定阈值时就抛出异常。 在ProviderInvoker的调用过程中,添加限流逻辑: 使用滑动窗口SlidingTimeWindow统计30s的请求数;每个服务service对应一个滑动窗口&#…

神经网络--反向传播算法推导

神经网络–反向传播算法推导 文章目录 神经网络--反向传播算法推导概述神经网络模型反向传导算法 概述 以监督学习为例,假设我们有训练样本集 ( x ( i ) , y ( i ) ) (x^{(i)},y^{(i)}) (x(i),y(i)),那么神经网络算法能提供一种复杂且非线性的假设模型 …

route路由命令、ip route命令、default默认路由(0.0.0.0 )

文章目录 3. route语法3.1 查看路由表3.1 参数解释 3.2 添加路由记录3.2.1 添加到达单个目标主机的路由3.2.2 添加到达目标网络的路由3.2.3 添加默认路由 3.3 删除路由记录 4. ip route4.1 查看路由4.1.1 不带条件4.1.2 带条件 4.2 添加路由4.3 删除路由4.4 清空路由表&#xf…

elasticsearch7安全配置--最低安全等级,用户名密码

上一篇博客在centos7上安装了elasticsearch7 接下来对elasticsearch进行安全方面的配置 minimal security 最低安全等级,用户名密码 首先开启xpack vim config/elasticsearch.yml xpack.security.enabled: true由于我是单机配置的,还加了如下配置 d…

JavaScript:事件循环机制(同步、异步)(单、多线程)

事件循环机制: 多进程和多线程 1. 进程:程序的一次执行, 它占有一片独有的内存空间 2. 线程: CPU的基本调度单位, 是程序执行的一个完整流程 3. 进程与线程 * 一个进程中一般至少有一个运行的线程: 主线程 * 一个进程中也可以同时运行多个线程, 我们…

ADC的认识

ADC介绍 Q:ADC是什么? A:全称:Analog-to-Digital Converter,指模拟/数字转换器 ADC的性能指标 量程:能测量的电压范围分辨率:ADC能辨别的最小模拟量,通常以输出二进制数的位数表示&#xf…

有限差分法求解一维、二维波动方程

差分格式方法是数值计算方法中微分以及偏微分导数的一种离散化方法。具体来说,它使用相邻两个或者多个数值点的差分来取代偏微分方程中的导数或偏导数。选择差分格式是离散化偏微分方程的第一步,通过这种离散化,我们可以将连续空间区域上的问…

面试通关秘籍:一面到终面的秘密

在当今竞争激烈的职场中,面试已经成为求职者和企业之间互相了解和选择的重要环节。面试过程常常被划分为多个阶段,包括一面(初次面试)、二面(二次面试)、三面(深入面试)以及终面&…

入门:多层感知器Multiple-Layer Perceiver, MLP

本文将简单介绍多层感知器(MLP)的基本概念、原理和应用。MLP是一种前馈人工神经网络,由多层节点组成,每层节点通过权重和偏置与下一层节点相连。MLP在许多领域都有广泛的应用,如分类、回归、自然语言处理等。 本文将分…

Windows不常见问题集

● 解决CACLS 禁止修改计算机名 管理员权限运行cmd:cacls %SystemRoot%\System32\netid.dll /grant administrators:f ● Excel 2010 AltTab組合鍵設置 HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Explorer,在該路徑建32字元DWO…