激活函数

news/2024/11/14 19:47:04/文章来源:https://www.cnblogs.com/kakafa/p/18546645


一、正向传播和反向传播


  • 在模型训练过程中,是同时包含正向传播和反向传播的

    • 正向传播是模型根据输入数据和当前的参数(权重和偏置)计算预测输出的过程。例如,在一个图像分类神经网络模型中,输入是图像的像素数据,经过多个隐藏层的计算,最终在输出层得到预测的类别概率分布。

    • 反向传播紧接着正向传播进行。它基于正向传播得到的预测输出和真实标签之间的差异(通过损失函数来衡量),计算每个参数的梯度。这个梯度表示了参数对损失函数的影响程度,然后利用这些梯度来更新模型的参数(权重和偏置)。

    • 这种正向传播和反向传播的交替进行是模型训练的核心机制。每次正向传播得到预测结果后,通过反向传播调整参数,然后再进行下一次正向传播,如此反复,直到模型收敛(即损失函数的值不再显著下降或者达到预设的训练轮数等停止条件)。


  • 在多层神经网络中,即使中间层没有像输出层那样的真实标签,依然可以进行反向传播。

    • 在反向传播阶段,中间层的参数更新是基于损失函数对输出层的影响,通过链式法则将误差从输出层反向传播回中间层来间接利用损失函数,以此来更新中间层的参数,使网络整体朝着损失减小的方向优化。




二、梯度消失 梯度爆炸


  • 梯度消失时,靠近输入层的网络层的参数更新变得非常缓慢。因为参数更新是通过梯度乘以学习率来实现的,梯度接近于零会导致这些层的参数几乎无法更新,使得模型难以学习到输入数据的有效特征,从而导致训练过程漫长,甚至无法收敛到一个较好的结果

  • 梯度爆炸会使模型的训练过程变得极不稳定。参数更新步长过大可能会导致模型在训练过程中跳过最优解,甚至无法收敛。





三、激活函数


  • 在神经网络的训练过程中,激活函数主要用于前向传播(Forward Propagation)阶段的神经元计算

  • 激活函数在隐藏层中的作用:

    • 控制神经元输出范围:例如,Sigmoid 函数的输出范围是(0,1),Tanh 函数的输出范围是(-1,1),在使用反向传播算法更新权重时,如果神经元的输出范围过大,可能会导致梯度消失或梯度爆炸问题。而通过合适的激活函数控制输出范围,可以在一定程度上缓解这些问题。

    • 引入非线性因素:如果没有激活函数,神经网络的每一层都只是对输入进行线性变换。而激活函数可以打破这种线性关系。例如,使用 ReLU 激活函数,多层神经网络通过激活函数的非线性作用,就可以逼近任何复杂的函数,从而能够更好地拟合数据中的复杂模式。


  • 激活函数在输出层中的作用:

    • 对于分类任务:多分类使用 Softmax 激活函数。Softmax 函数可以将神经元的输出转换为概率分布;对于二分类任务,Sigmoid 函数是常用的激活函数。

    • 对于回归任务:在回归任务中,输出层通常不使用激活函数,或者使用线性激活函数(即输出等于输入)。因为回归任务的目标是预测一个连续的值,不需要将输出转换为概率或限制在特定的范围内。





四、激活函数有哪些


  1. Sigmoid函数

    • 函数表达式及性质
    • 适用情况
      • 二分类问题的输出层:如在判断一封邮件是否为垃圾邮件。
      • 概率估计场景:如在医学诊断中,预测患者患有某种疾病的概率。
  2. Tanh函数(双曲正切函数)

    • 函数表达式及性质
    • 适用情况
      • 隐藏层:Tanh函数通常用于神经网络的隐藏层。与Sigmoid函数相比,它的输出范围更对称,中心在0点。这使得在反向传播过程中,梯度的更新更稳定。例如,在多层感知机(MLP)用于时间序列预测的隐藏层中,Tanh函数可以帮助模型更好地学习数据中的正负特征。
      • 需要输出中心为零的数据场景:当希望神经元的输出在正负区间都有分布,并且对数据的正负特征都比较敏感时,Tanh函数是比较合适的。比如在一些信号处理相关的神经网络应用中,Tanh函数可以更好地处理正负信号。
  3. ReLU函数(修正线性单元)

    • 函数表达式及性质
    • 适用情况
      • 隐藏层和输出层广泛应用:ReLU函数是目前深度学习中最常用的激活函数之一,广泛应用于神经网络的隐藏层和输出层。在图像识别、语音识别等众多领域的深度学习模型的隐藏层中,ReLU函数能够有效缓解梯度消失问题,加速模型的训练。例如,在卷积神经网络(CNN)用于图像分类任务时,如ResNet、VGG等模型的隐藏层大量使用ReLU函数。
      • 处理非负数据场景:如果数据本身具有非负的特性或者希望神经元输出非负的值,ReLU函数是一个自然的选择。例如,在处理图像像素值(通常是非负的)的神经网络中,ReLU函数可以很好地适应这种数据特性。
  4. Leaky ReLU函数

    • 函数表达式及性质
    • 适用情况
      • 缓解ReLU函数的“神经元死亡”问题:在一些情况下,ReLU函数可能会导致神经元“死亡”,即某些神经元在训练过程中永远不会被激活(输出始终为0)。Leaky ReLU函数通过为负数输入提供一个小的梯度,降低了这种风险。在一些对模型稳定性要求较高的应用中,如深度强化学习中的价值网络或者深度生成模型的某些部分,Leaky ReLU可以作为ReLU的替代选择。
  5. Softmax函数

    • 函数表达式及性质
    • 适用情况
      • 多分类问题的输出层:在神经网络用于多分类任务时,Softmax函数是输出层的常用激活函数。例如,在手写数字识别(MNIST数据集)任务中,输出层有(10)个神经元,经过Softmax函数后,这(10)个输出值分别表示数字(0 - 9)的概率,概率最高的类别即为预测的类别。Softmax 函数输出的所有概率之和是1



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/833589.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centOS7 docker 安装步骤

一、安装前检查工作: 1.检查/etc/yum.repos.d/CentOS-Base.repo文件是否存在,如果不存在,从网络仓库中复制一份新的 CentOS-Base.repo 文件。 sudo curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 或者使用 wget: sudo wget -O /…

k8s 1.28.2 集群部署 docker registry 接入 MinIO 存储

目录docker registry 部署生成 htpasswd 文件生成 secret 文件生成 registry 配置文件创建 service创建 statefulset创建 ingress验证 docker registrydocker registry 监控docker registry uidocker registry dockerfile docker registry 配置文件 S3 storage driver registry…

[68] (炼石计划) NOIP 模拟赛 #20

学了一个挺帅的 MerMaid 所以用一下 flowchart TBA(邻间的骰子之舞)style A color:#ffffff,fill:#00c0c0,stroke:#ffffff 考虑每次复制以后一定会粘贴若干次(大于零,否则没有意义),因此将复制粘贴捆绑起来考虑,设复制后连续粘贴了 \(m\) 次,则代价为 \(x+my\),贡献为让编…

团队项目Scrum冲刺-day4

一、每天举行站立式会议 站立式会议照片一张昨天已完成的工作成员 任务陈国金 用户模块接口开发凌枫 整合MD编辑器陈卓恒 完成管理题目页面谭立业 完成题目搜索页面廖俊龙 接口测试曾平凡 前端页面测试曾俊涛 完成题目模块接口开发薛秋昊 完成题目提交模块接口开发今天计划完成…

【闲话】先觉

题图太大了,遂放到里面了能 窥探 到未来的 命运 又怎样? 不愿向 命运 屈服,自以为一次次地“战胜” 命运 后却不知一切都是 命运 早就 安排 好的。亦或是他即是 命运 的代理人。 不久后的 毁灭 已成为他的梦魇,面对好友的一个个离去他 无能为力 ,只好请求 那位大人 伸出援…

团队作业4——项目冲刺-4

团队作业4——项目冲刺-4信息项 内容课程名称 广工计院计科34班软工作业要求位置 作业要求作业目标 在七天敏捷冲刺中,完成工大严选开发,记录每日进展和问题,更新燃尽图、签入代码,并发布集合日志总结成果GitHub链接 GitHub一、团队简介队名:小飞棍队团队成员:姓名 学号罗…

MX 2025--炼石计划 NOIP 模拟赛 #20

斥责打得抽象。T3,T4放俩难的板子。由于是MX的题,就不放题意了。 邻间的骰子之舞 发现复制操作不会超过\(64\)次,而粘贴操作肯定是越均匀越好,直接二分暴力跑就行了。点此查看代码 #include<bits/stdc++.h> using namespace std; #define rep(i,s,t,p) for(int i = s;…

EBS:物料搬运单查看人限制(创建人栏位)

EBS:物料搬运单查看人限制(创建人栏位)Applies to:Oracle Inventory Management - Version: 11.5.9 to 12.0.0 - Release: 11.5 to 12.2Information in this document applies to any platform.FORM:INVTOMAI.FMB - Response CenterSymptomsIn the Move Orders form (INVTOMA…

实景三维赋能智慧公安建设

在新型智慧城市建设的大潮中,智慧公安作为关键一环,对于提高城市安全和治理效率具有重要意义。实景三维技术以其独特的优势,为智慧公安建设提供了强有力的支撑。本文将探讨实景三维技术如何赋能智慧公安建设。一、智慧公安建设的重要性智慧公安是利用现代信息技术,实现对城…

OpenAI模型whisper 音频转文本

最近有一个音频转文本的需求,了解到了OpenAI的whisper模型可以实现。 Whisper 是 OpenAI 提供的一个通用语音识别模型,支持多语言的音频转文本功能,并具有较高的准确性。它的主要用途包括自动语音识别 (ASR)、语言翻译(将音频直接翻译成英文文本)等。Whisper 支持将长时间…

想定制RK3562主板Android系统的开机动画和桌面壁纸吗?看这篇文章就够了

本文介绍瑞芯微RK3562开发板在安卓Android13系统替换开机动画和桌面壁纸的方法,使用触觉智能EVB3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1T算力 NPU,可用于轻量级人工智能应用。 开机动画替换 将做好的开机动画文件bootanimation.zip包拷贝至 vendor/roc…

mysql可视化工具 Navicat Premium 12解压版

通过网盘分享的文件:Navicat Premium 12解压版.rar链接: https://pan.baidu.com/s/1kDLlrcaiQRYGLfN5L-IpPA?pwd=3k6h 提取码: 3k6h --来自百度网盘超级会员v8的分享1.解压到指定路径 2.快捷方式,快捷方式用不了,就直接在该文件中直接打开 3. 测试链接