[论文阅读] VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

news/2025/1/1 8:09:32/文章来源:https://www.cnblogs.com/lichunlei/p/18523097

写在前面

原文:https://arxiv.org/pdf/1409.1556
参考:https://www.cnblogs.com/lijiuliang/p/15133276.html
关键字:卷积网络、卷积网络深度、图像识别
阅读理由:卷积神经网络深度与算法优良性能之间的关系是什么,如何评估的,结果如何,有哪些思考
前置知识:CNN(也是我写滴嘻嘻(#..#))、filter

速览

研究了什么

卷积网络深度在大规模的图像识别环境下对准确性的影响

怎么研究的

使用非常小的(3x3)filters对网络深度的增加进行全面评估

研究结果

通过将深度推到16-19加权层可以实现对现有技术配置的显著改进

文章结构

(本文的逻辑十分之清晰,非常值得学习)

一.网络配置

网络配置
如图所示
1.输入
图片规格:3个通道,224x224
预处理操作:计算出3个通道的平均值,在每个像素上减去平均值(处理后迭代更少);

2.关于卷积层
大部分网络架构使用非常小的3x3卷积核贯穿整个网络;
少数网络架构还使用了1x1卷积核;
卷积层步长(stride)=1,3x3卷积核的填充(padding)=1;
所有隐藏卷积层都配备了ReLU非线性激活。

3.关于池化层
整个网络架构的池化总共由5个“最大池化层”实现;
池化窗口为2x2,步长=2。

4.关于全连接层
所有卷积操作之后跟有3个全连接层:
前2个:均为4096通道;
最后1个:1000个通道;

5.全连接层之后是SoftMax分类器。

6.另:LRN
在深度学习中,局部响应归一化(Local Response Normalization,简称LRN)是一种用于神经网络层的技术。它的主要作用是对输入数据进行归一化处理,以减少内部协方差偏移的影响。

在神经网络中,每个神经元都接收到来自前一层的所有神经元的输出,并将其作为输入。这些输入被加权求和后通过激活函数产生输出。然而,在训练过程中,由于权重初始化的不同、梯度下降算法的随机性等原因,不同神经元的输出可能会出现内部协方差偏移的现象,即某些神经元的输出过大或过小,导致整个网络的性能下降。

为了解决这个问题,LRN技术引入了一种新的归一化方法,通过对每个神经元的输入进行局部归一化来减少内部协方差偏移的影响,提高了模型的泛化能力

需要注意的是,LRN技术并不是所有情况下都能提高模型的性能。比如本文,使用LRN不仅没有提高性能,反而增加了内存消耗和计算时间

二.分类框架

(描述了分类卷积神经网络训练和评估的细节)
先留坑,等我再学习一下更多的原理再补上

三.分类实验

四.实验结论

我的总结

  1. 本文提到的卷积神经网络的优化方法有三
    一种方法是在第一层卷积中使用更小的感受野窗口和步幅。
    另一个改进方向是密集地训练和测试网络,使其在整个图像上以及多个尺度下进行处理。这种方法可以提高模型的鲁棒性和泛化能力。
    第三种是卷积神经网络的深度问题。通过固定其他参数,增加更多的卷积层来增加网络的深度。这得益于非常小的(3x3)卷积滤波器在所有层中的应用。这种设计使得更深的网络可以在不牺牲精度的情况下保持较小的计算复杂度。

  2. 3X3卷积核的优势

  • 减少网络参数
    参数量=(filter size * 前一层特征图的通道数 )* 当前层filter数量
    对于两个3x3卷积核,所用的参数总量为2×32×channels(假设保证输入输出通道数不变);
    对于单个5x5卷积核,参数量为52×channels

  • 增加更多的非线性变换
    2个3x3卷积层拥有比1个5x5卷积层更多的非线性变换(前者可以使用两次ReLU激活函数,而后者只有一次),使得卷积神经网络对特征的学习能力更强。

  1. 但是卷积神经网络的深度越深越好吗?
    当然不是,具体可见resnet

  2. 是否可以将这些优化方法分为大类,每一类的优化方法还有哪些?这些优化方法是通用优化方法还是在某些情况下的?他们是不是和网络深度一样在某些情况下有发挥不好的地方?针对这个问题又有什么解决思路和方法呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/826101.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

strlen函数的模拟实现

首先我们先新建项目,并新建源文件 然后先调用sring.h里的strlen函数看看该函数的效果 可以看到strlen的结果为字符串"abc"的长度 我们又知道对于字符串"abc"实际上在字符串尾部会存在\0,即字符串arr实际上是"abc\0" 那么先定义自定义函数my_st…

2024-2025-1(20241321)《计算机基础与程序设计》第六周学习总结

这个作业属于哪个课程 <班级的链接>(2024-2025-1-计算机基础与程序设计)这个作业要求在哪里 <作业要求的链接>(2024-2025-1计算机基础与程序设计第一周作业)这个作业的目标 <了解并学习AI功能,回顾一周课程心得>作业正文 ... 本博客链接https://www.cnblo…

Java学习十七—反射机制:解锁代码的无限可能

Java 反射(Reflection)是Java 的特征之一,它允许程序在运行时动态地访问和操作类的信息,包括类的属性、方法和构造函数。Java学习十七—反射机制:解锁代码的无限可能 一、关于反射 1.1 简介 Java 反射(Reflection)是Java 的特征之一,它允许程序在运行时动态地访问和操作类的…

行人闯红灯自动监测系统

行人闯红灯自动监测系统利用现场已有的监控摄像头,当路口有行人通过时,行人闯红灯自动监测系统设备自动监测识别是人体。一旦识别到人行横道区域有行人通行,系统就会自动判定并发出警告。同时,系统还能够识别红绿灯的状态,如果红灯亮起,系统就会通过声光联合告警,提醒行…

学校食堂互联网明厨亮灶方案

学校食堂互联网明厨亮灶方案利用现场已有的监控摄像头智能识别后厨人员穿戴情况,学校食堂互联网明厨亮灶方案针对没有戴厨师帽、口罩、工作服、玩手机、吸烟、垃圾桶未盖盖、明火离岗等违规行为的后厨人员第一时间进行识别、抓拍、报警提醒。这种方案通过AI技术实现了对后厨人…

变电站隔离刀闸状态自动识别系统

变电站隔离刀闸状态自动识别系统采用超高速动态图像并行处理算法,变电站隔离刀闸状态自动识别系统通过现场监控摄像头对隔离刀闸进行实时图像采集,并利用图像识别技术对刀闸状态进行自动判断。该系统可实现一站多组刀闸、多站多组刀闸位置、运行状态等同时检测,速度快,识别…

2,后台部署

基本流程图确保可通服务器客户端 ping 服务器外网IP地址安装应用服务通过LAMP,一键安装部署 命令生成地址:https:lnmp.org/auto.html (只针对PHP项目部署)安装服务验证检查Apache的服务是否运行sestemctl status httpd检查MySQL是否运行sestemctl status mysql检查PHP是否安装…

Python311新特性-特化指令specializing adaptive interpreter-typing-asyncio

Python311新特性-特化指令specializing adaptive interpreter-typing-asyncioPython3新特性 python3.11增加了许多特性,让python更快更加安全,本文从应用层面来讲一下python3.11的这些新特性 特化自适应解析器是什么,如何利用特化写出更高性能的代码 如何在项目中落地type h…

Python模拟真人动态生成鼠标滑动路径

一.简介 鼠标轨迹算法是一种模拟人类鼠标操作的程序,它能够模拟出自然而真实的鼠标移动路径。 鼠标轨迹算法的底层实现采用C/C++语言,原因在于C/C++提供了高性能的执行能力和直接访问操作系统底层资源的能力。 鼠标轨迹算法具有以下优势: 模拟人工轨迹:算法能够模拟出非…

猿人学web端爬虫攻防大赛赛题第2题——动态cookie

题目网址:https://match.yuanrenxue.cn/match/2 解题步骤看触发的数据包。在请求头中的cookie字段中m变量的值一看就是加密过的。看Initiator模块中的request。点进去,打断点。我们只能在响应内容中看到页面数据,但是关于m的加密却是没有看到。刷新界面,出现如下画面。说明…

易语言模拟真人动态生成鼠标滑动路径

一.简介 鼠标轨迹算法是一种模拟人类鼠标操作的程序,它能够模拟出自然而真实的鼠标移动路径。 鼠标轨迹算法的底层实现采用C/C++语言,原因在于C/C++提供了高性能的执行能力和直接访问操作系统底层资源的能力。 鼠标轨迹算法具有以下优势: 模拟人工轨迹:算法能够模拟出非…

C++模拟真人动态生成鼠标滑动路径

一.简介 鼠标轨迹算法是一种模拟人类鼠标操作的程序,它能够模拟出自然而真实的鼠标移动路径。 鼠标轨迹算法的底层实现采用C/C++语言,原因在于C/C++提供了高性能的执行能力和直接访问操作系统底层资源的能力。 鼠标轨迹算法具有以下优势: 模拟人工轨迹:算法能够模拟出非…