神经网络之卷积篇:详解卷积神经网络示例(Convolutional neural network example)

news/2025/1/12 2:48:46/文章来源:https://www.cnblogs.com/oten/p/18397938

详解卷积神经网络示例

假设,有一张大小为32×32×3的输入图片,这是一张RGB模式的图片,想做手写体数字识别。32×32×3的RGB图片中含有某个数字,比如7,想识别它是从0-9这10个数字中的哪一个,构建一个神经网络来实现这个功能。

用的这个网络模型和经典网络LeNet-5非常相似,灵感也来源于此。LeNet-5是多年前Yann LeCun创建的,所采用的模型并不是LeNet-5,但是受它启发,许多参数选择都与LeNet-5相似。输入是32×32×3的矩阵,假设第一层使用过滤器大小为5×5,步幅是1,padding是0,过滤器个数为6,那么输出为28×28×6。将这层标记为CONV1,它用了6个过滤器,增加了偏差,应用了非线性函数,可能是ReLU非线性函数,最后输出CONV1的结果。

然后构建一个池化层,这里选择用最大池化,参数\(f=2\)\(s=2\),因为padding为0,就不写出来了。现在开始构建池化层,最大池化使用的过滤器为2×2,步幅为2,表示层的高度和宽度会减少一半。因此,28×28变成了14×14,通道数量保持不变,所以最终输出为14×14×6,将该输出标记为POOL1

人们发现在卷积神经网络文献中,卷积有两种分类,这与所谓层的划分存在一致性。一类卷积是一个卷积层和一个池化层一起作为一层,这就是神经网络的Layer1。另一类卷积是把卷积层作为一层,而池化层单独作为一层。人们在计算神经网络有多少层时,通常只统计具有权重和参数的层。因为池化层没有权重和参数,只有一些超参数。这里,把CONV1POOL1共同作为一个卷积,并标记为Layer1。虽然在阅读网络文章或研究报告时,可能会看到卷积层和池化层各为一层的情况,这只是两种不同的标记术语。一般在统计网络层数时,只计算具有权重的层,也就是把CONV1POOL1作为Layer1。这里用CONV1POOL1来标记,两者都是神经网络Layer1的一部分,POOL1也被划分在Layer1中,因为它没有权重,得到的输出是14×14×6。

再为它构建一个卷积层,过滤器大小为5×5,步幅为1,这次用10个过滤器,最后输出一个10×10×10的矩阵,标记为CONV2

然后做最大池化,超参数\(f=2\)\(s=2\)。大概可以猜出结果,\(f=2\)\(s=2\),高度和宽度会减半,最后输出为5×5×10,标记为POOL2,这就是神经网络的第二个卷积层,即Layer2

如果对Layer1应用另一个卷积层,过滤器为5×5,即\(f=5\),步幅是1,padding为0,所以这里省略了,过滤器16个,所以CONV2输出为10×10×16。看看CONV2,这是CONV2层。

继续执行做大池化计算,参数\(f=2\)\(s=2\),能猜到结果么?对10×10×16输入执行最大池化计算,参数\(f=2\)\(s=2\),高度和宽度减半,计算结果猜到了吧。最大池化的参数\(f=2\)\(s=2\),输入的高度和宽度会减半,结果为5×5×16,通道数和之前一样,标记为POOL2。这是一个卷积,即Layer2,因为它只有一个权重集和一个卷积层CONV2

5×5×16矩阵包含400个元素,现在将POOL2平整化为一个大小为400的一维向量。可以把平整化结果想象成这样的一个神经元集合,然后利用这400个单元构建下一层。下一层含有120个单元,这就是第一个全连接层,标记为FC3。这400个单元与120个单元紧密相连,这就是全连接层。这是一个标准的神经网络。它的权重矩阵为\(W^{\left\lbrack 3 \right\rbrack}\),维度为120×400。这就是所谓的“全连接”,因为这400个单元与这120个单元的每一项连接,还有一个偏差参数。最后输出120个维度,因为有120个输出。

然后对这个120个单元再添加一个全连接层,这层更小,假设它含有84个单元,标记为FC4

最后,用这84个单元填充一个softmax单元。如果想通过手写数字识别来识别手写0-9这10个数字,这个softmax就会有10个输出。

此例中的卷积神经网络很典型,看上去它有很多超参数,关于如何选定这些参数,后面提供更多建议。常规做法是,尽量不要自己设置超参数,而是查看文献中别人采用了哪些超参数,选一个在别人任务中效果很好的架构,那么它也有可能适用于自己的应用程序。

现在,想指出的是,随着神经网络深度的加深,高度\(n_{H}\)和宽度\(n_{W}\)通常都会减少,前面就提到过,从32×32到28×28,到14×14,到10×10,再到5×5。所以随着层数增加,高度和宽度都会减小,而通道数量会增加,从3到6到16不断增加,然后得到一个全连接层。

在神经网络中,另一种常见模式就是一个或多个卷积后面跟随一个池化层,然后一个或多个卷积层后面再跟一个池化层,然后是几个全连接层,最后是一个softmax。这是神经网络的另一种常见模式。

接下来讲讲神经网络的激活值形状,激活值大小和参数数量。输入为32×32×3,这些数做乘法,结果为3072,所以激活值\(a^{[0]}\)有3072维,激活值矩阵为32×32×3,输入层没有参数。计算其他层的时候,试着自己计算出激活值,这些都是网络中不同层的激活值形状和激活值大小。

有几点要注意,第一,池化层和最大池化层没有参数;第二卷积层的参数相对较少,之前提到过,其实许多参数都存在于神经网络的全连接层。观察可发现,随着神经网络的加深,激活值尺寸会逐渐变小,如果激活值尺寸下降太快,也会影响神经网络性能。示例中,激活值尺寸在第一层为6000,然后减少到1600,慢慢减少到84,最后输出softmax结果。发现,许多卷积网络都具有这些属性,模式上也相似。

神经网络的基本构造模块已经讲完了,一个卷积神经网络包括卷积层、池化层和全连接层。许多计算机视觉研究正在探索如何把这些基本模块整合起来,构建高效的神经网络,整合这些基本模块确实需要深入的理解。根据经验,找到整合基本构造模块最好方法就是大量阅读别人的案例。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/792484.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

火山引擎VeDI赋能小城酒店业,助力“流量”向“留量”转化

对小城酒店业而言,市场红利期的机遇从天而降。在此背景下,争取以优质服务打动游客、将短暂“流量”化为“留量”,才是其真正实现长足发展的关键一步。而火山引擎数智平台VeDI,或许可以成为小城酒店实现进一步智能升级的助力点。更多技术交流、求职机会,欢迎关注字节跳动数…

网站提示“PHP配置错误:如内存限制、执行时间限制等问题”错误如何解决

当您遇到“PHP配置错误”,如内存限制、执行时间限制等问题时,这通常意味着您的PHP脚本超过了PHP.ini配置文件中设定的某些限制。这类问题可能导致脚本执行中断或产生错误。以下是一些解决这些问题的方法: 常见的PHP配置错误内存限制(memory_limit):当PHP脚本消耗的内存超…

Java接口使用指南:开启高效编程之门

https://img2024.cnblogs.com/blog/3506472/202409/3506472-20240905103248440-1956252110.png在Java编程世界中,接口是实现模块间通信的一种核心机制。它们定义了一组方法规范,允许不同的类或系统按照统一的方式进行交互。随着互联网服务的兴起,API(应用程序编程接口)成为…

网站提示“Duplicate entry:插入重复记录”错误如何解决

当您遇到“Duplicate entry:插入重复记录”的错误时,这意味着您尝试向数据库中插入的数据违反了唯一性约束。这种情况通常发生在以下几种情形下:主键索引重复:尝试插入的记录的主键值与表中已有的主键值相同。 唯一索引重复:如果表中有一个或多个列被定义为具有唯一约束的…

网站提示“文件权限错误”错误如何解决

当您遇到“文件权限错误”时,这通常意味着文件系统上的某个文件或目录不允许当前用户进行所需的访问操作,如读取、写入或执行。这类问题常见于Web服务器环境中,尤其是当试图上传文件、保存配置文件或执行脚本时。以下是解决文件权限错误的一些步骤: 基础排查检查文件或目录…

网站提示“数据库相关错误”错误如何解决

当您遇到“数据库相关错误”时,这类错误通常意味着网站在尝试访问数据库时遇到了问题。这类问题可能由多种因素引起,下面是一些常见的解决步骤: 基本检查确认数据库连接信息:确认数据库的用户名、密码、主机名/IP地址以及端口号是否正确。检查网站配置文件(如WordPress的w…

网站提示“503 Service Unavailable:服务器暂时无法处理请求”错误如何解决

当您遇到“503 Service Unavailable:服务器暂时无法处理请求”的错误时,这表示服务器当前不能处理请求,但预计稍后可以恢复。这可能是由于服务器过载、正在进行维护、配置错误或其他暂时性问题。以下是解决此类问题的一些步骤:检查服务器负载:确认服务器是否过载。如果服务…

重生之当IT管理员遇到数据摆渡界“悟空”!

您可以搜索“飞驰云联”了解更多信息。 关于飞驰云联 飞驰云联是中国领先的数据安全传输解决方案提供商,长期专注于安全可控、性能卓越的数据传输技术和解决方案,公司产品和方案覆盖了跨网跨区域的数据安全交换、供应链数据安全传输、数据传输过程的防泄漏、FTP的增强和国产化…

科技服务行业ITSM案例分析报告

一、项目背景 随着科技服务行业的快速发展,企业面临着日益增长的数据处理和业务支持需求。为了保持竞争力,科技服务公司不仅需要依赖于快速迭代的技术产品,还需要有一个灵活且高效的运维体系来支持其业务的发展。在这个背景下,上海采和信息科技有限公司(采和科技)凭借其在…

网站提示“404 Not Found:请求的资源未找到”错误如何解决

当您遇到“404 Not Found:请求的资源未找到”的错误时,可以按照以下步骤来尝试解决问题:检查URL是否正确:确认URL没有拼写错误。 检查是否有任何字符被错误地添加或删除。 确保使用正确的大小写(某些服务器区分大小写)。清除浏览器缓存和Cookies:浏览器缓存可能会保存旧…

VMware Workstation 17.6 Pro Unlocker OEM BIOS 2.7 for Windows Linux

VMware Workstation 17.6 Pro Unlocker & OEM BIOS 2.7 for Windows & LinuxVMware Workstation 17.6 Pro Unlocker & OEM BIOS 2.7 for Windows & Linux 在 Windows 和 Linux 上运行 macOS Sequoia 请访问原文链接:https://sysin.cn/blog/vmware-workstation…

MongoDB单节点部署与基本操作

MongoDB 7.0 单节点部署 与 MongoDB shell基本操作 部署准备:1、操作系统:CentOS7.9 2、在操作系统中,创建一个mongod的用户和用户组,并配置其sudo权限,如果使用root用户可以不考虑准备此项。3、mongodb服务二进制包:mongodb-linux-x86_64-rhel70-7.0.14.tgz 。 下载地址…