新手入门深度学习 | 6-2:AlexNet(2012)详解

  • 🔗 运行环境:python3
  • 🚩 作者:K同学啊
  • 🥇 精选专栏:《深度学习100例》
  • 🔥 推荐专栏:《新手入门深度学习》
  • 📚 选自专栏:《Matplotlib教程》
  • 🧿 优秀专栏:《Python入门100题》
  • 本文选自专栏:🚀《新手入门深度学习》

AlexNet是引起卷积神经网络热潮的一个网络,产生于2012年,一直是神经网络中比较火热的网络之一,赢得了2012年ImageNet竞赛。AlexNet是更深的LeNet,采用ReLu激活函数和最大池化方法,由输入层、卷积层、池化层、全连接层、输出层构成,包含六千万个参数和65000个神经元,计算层有3个卷积层,3个全连接层,最终输出层为1000通道的Softmax。AlexNet利用了两块GPU进行计算,大大提高了运算效率,并且在ILSVRC-2012竞赛中获得了top-5测试的15.3% error rate,获得第二名的方法error rate为26.2%,相比具有很大差距,在学术界产生了巨大的影响力。

AlexNet网络结构简图如图1所示,包含输入层(Input)、输出层(Output)、5个卷积层(Convolutional layer,Conv)、3个池化层(Pooling layer)、3个全连接层(Fully connected layer,FC)。从对图像的处理过程来看,将图片统一处理成为224×224×3的大小作为输入,经过第一个卷积层进行卷积计算提取特征,其中卷积核大小为11×11×3,个数为96个;经过3×3的最大池化(Max pooling)后,输入到第二个卷积层,其中卷积核大小为5×5×48,共256个;下一层经过3×3的最大池化过程后,其输出进行三个连续卷积层计算,第三层卷积层内核大小3×3×256,共384个,第四层卷积层内核大小3×3×192,共384个,第五层卷积层内核大小3×3×192,共256个;再经过3×3的最大池化,以及三个连续的全连接层计算,最后输出1000类的图像识别结果。

图1 AlexNet结构简图

为使卷积神经网络应用到众多的非线性模型中,在卷积层中引入激活函数,对于神经网络的学习和理解复杂非线性函数有着重要意义。激活函数存在每个神经元的输出之后,在神经元输入数据通过加权求和后,经过激活函数计算进行输出。神经网络的学习过程是神经元参数根据期望结果不断更新的过程,这时要通过神经网络的反向传播来计算更新,激活函数对于神经网络的反向传播有着重要的意义。如果神经元没有被激活或者激活状态没有达到饱和,权重的更新速度会非常慢甚至停止。对神经网络的学习造成严重影响。

早期的激活函数有Sigmoid函数,Tanh函数,可以很好地压缩输出,但容易造成梯度消失问题。随着不断的理论积累,学术界发现ReLu函数,LeakyReLu函数等效果更好的激活函数,成为卷积神经网络的首选激活函数。

关于AlexNet实战内容请看文章:🔥【深度学习100例-卷积神经网络(AlexNet)手把手教学 | 第11天】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/8518.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K8S-二进制部署

二进制搭建 Kubernetes v1.20 k8s集群master01:192.168.22.10 kube-apiserver kube-controller-manager kube-scheduler etcd k8s集群master02:192.168.22.20 k8s集群node01:192.168.22.11 kubelet kube-proxy docker k8s集群node02&#x…

30分钟,认识 html 本质

30分钟,认识 html 本质 html 是什么?html 起源html 发展标签分类空间占用方式布局文本修饰流媒体标签 预定义符号 Symbols弃用的部分标签学习 html html 是什么? HTML的英文全称是 Hyper Text Markup Language,即超文本标记语言。…

Spring Boot中RabbitMQ自动配置的介绍、原理和使用

Spring Boot中RabbitMQ自动配置的介绍、原理和使用 引言 RabbitMQ是一种高性能的消息队列系统,它支持多种消息协议和丰富的功能,如消息路由、消息确认、消息重试、死信队列等。在Spring Boot中,我们可以通过自动配置的方式来使用RabbitMQ。…

ICMP类型

ICMP(Internet Control Message Protocol)Internet控制报文协议。它是TCP/IP协议簇的一个子协议,用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息。这些控制消息虽然并不传输用户…

命令模式的学习与使用

1、命令模式的学习 当你想要将请求与实际执行操作的对象解耦时,可以使用命令模式。它将一个请求封装为一个对象,从而使你可以根据不同的请求将其参数化,将请求队列或日志请求,并支持可撤销的操作。   命令模式由以下几个核心角色…

Can’t connect to MySQL server on ‘localhost’ (10061)

标题:Can’t connect to MySQL server on ‘localhost’ (10061) 一种情况是,mysql服务没有开启, 解决方式:以管理员身份进入cmd,然后输入net start mysql,注意这里的mysql,指的是你的mysql服务的名称&am…

Vue + electron 构建桌面应用程序

文章目录 需求分析解决 需求 使用Vue.js构建桌面应用程序 分析 选择一个Vue.js框架:选择一个适合你的Vue.js框架。推荐使用Electron,因为它是最流行的桌面应用程序框架之一,而且与Vue.js非常兼容。还有其他框架,如 Proton Native…

【SCI/EI/CNKI录用案例】最快8天录用

生命科学类SCI 【期刊简介】IF:2.5-3.0,JCR2区,中科院3区 【检索情况】SCI 在检,正刊 【征稿领域】生物科学、环境科学、医学科学和健康科学方向相关研究均可 【截稿时间】仅剩10篇版面左右 录用案例:仅1个月13天录…

基于深度学习的高精度工人安全帽检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度工人安全帽检测识别系统可用于日常生活中或野外来检测与定位工人安全帽目标,利用深度学习算法可实现图片、视频、摄像头等方式的工人安全帽目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用…

ThingsBoard IoT Gateway 专栏 分享 前言

最近有朋友询问tb-gateway相关的问题,于是抽业余时间查看了一下官方文档,并做了一些尝试和案例。接下来我会将这些分享给大家。这也是一个系列,将会和我的ThingsBoard专栏放在一起。 ThingsBoard IoT Gateway 能够帮助你将连接到传统和第三方…

idea中如何过滤某些文件不提交

文章目录 前言设置.gitignore文件解决方案 设置新的忽略文件具体步骤如下 常用过滤文件 前言 在开发过程中,经常会遇到一些文件是我们不想提交的内容。那么应该如何过滤掉?不去提交到我们的git仓库? 比如,我们常用的一些配置文件…

全新FinClip Studio 现已发布上线;正式支持多租户能力

FinClip 的使命是使您(业务专家和开发人员)能够通过小程序解决关键业务流程挑战,并完成数字化转型的相关操作。不妨让我们看看在本月的产品与市场发布亮点,看看是否有助于您实现目标。 产品方面的相关动向👇&#x1f…