神经网络中的神经元和激活函数介绍

文章目录

1、什么是人工神经网络

2、什么是神经元

3、什么是激活函数

线性激活函数

Sigmoid激活函数

双曲正切激活函数

修正线性单元(ReLU)激活函数

Leaky ReLU激活函数

Softmax激活函数


1、什么是人工神经网络

神经网络能够利用多层神经元学习复杂的模式,这些神经元会对数据进行数学变换。

输入层和输出层之间的层被称为“隐藏层”。

神经网络具有一种独特的能力,可以学习并识别数据中的复杂特征关系,而这些关系可能对于其他传统的算法来说难以直接发现和建模。

多层感知器(MLP)

上面的图表是一个多层感知器(MLP)。

一个MLP至少要有三层:输入层、隐藏层和输出层。

它们是完全连接的,即一层中的每个节点都通过权重与下一层中的每个节点相连。

深度学习这一术语用于指代由许多隐藏层构建的机器学习模型:深度神经网络。

2、什么是神经元

人工神经元(也被称为感知器)是一个数学函数。

它接收一个或多个输入,这些输入乘以被称为“权重”的值并相加。

然后,这个值被传递给一个非线性函数,称为激活函数,以生成神经元的输出。

  • x值指的是输入,要么是原始特征,要么是前一层隐藏层的输入。
  • 在每一层中,还有一个偏置b,它可以帮助更好地拟合数据。
  • 神经元将值a传递给下一层中与之连接的所有神经元,或者将其作为最终值返回。

计算从线性方程开始:

在添加非线性激活函数之前:

3、什么是激活函数

激活函数是神经元应用的一个非线性函数,用于在网络中引入非线性特性。

如果第一个变量的变化对应于第二个变量的恒定变化,那么这种关系就是线性的。

非线性关系意味着第一个变量的变化并不一定对应于第二个变量的恒定变化。

然而,它们可能会相互影响,但看起来是不可预测的。

通过引入非线性,我们可以更好地捕捉数据中的模式。

这是一个直观的例子。

最佳拟合线性和非线性模型

线性激活函数

  • 直线函数:a是一个常数
  • 值可能会变得非常大
  • 仅线性函数本身无法捕捉复杂的模式

Sigmoid激活函数

  • 是一个非线性函数,因此可以捕捉更复杂的模式
  • 输出值是有界的,因此不会变得太大
  • 可能会受到“梯度消失”的影响

双曲正切激活函数

  • 是一个非线性激活函数,因此可以捕捉更复杂的模式
  • 输出值是有界的,因此不会变得太大
  • 可能会受到“梯度消失”的影响

修正线性单元(ReLU)激活函数

  • 是一个非线性函数,因此可以捕捉更复杂的模式
  • 值可能会变得非常大
  • 由于它不允许负值,因此可能无法捕捉某些模式
  • 梯度可能趋于0,因此权重不会更新:“ReLU死亡问题”

Leaky ReLU激活函数

  • 是一个非线性函数,因此可以捕捉更复杂的模式
  • 尝试解决“ReLU死亡问题”
  • 值可能会变得非常大

另外,除了使用0.01,它也可以是一个参数\alpha,该参数在训练过程中与权重一起学习。这被称为参数化ReLU (PReLU)。

Softmax激活函数

  • 每个值的范围在0到1之间,并且所有值的和为1,因此可用于建模概率分布
  • 仅用于输出层,而不是整个网络

参考:人工智能学习指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/637642.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AlDente Pro for mac最新激活版:电池长续航软件

AlDente Pro是一款专为Mac用户设计的电池管理工具,旨在提供电池安全和健康管理的一站式解决方案。它具备实时监控电池状态的功能,让用户随时了解电池的电量、充电次数、健康状态等信息。 AlDente Pro for mac最新激活版下载 同时,AlDente Pro…

使用Python进行云计算:AWS、Azure、和Google Cloud的比较

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 使用Python进行云计算:AWS、Azure、和Google Cloud的比较 随着云计算的普及&am…

【高校科研前沿】东北地理所孙敬轩博士为一作在《中国科学:地球科学(中英文版)》发文:气候变化下东北地区农业绿水安全风险评估

目录 01 文章简介 02 研究内容 03 文章引用 04 期刊简介 01 文章简介 论文名称:Risk assessment of agricultural green water security in Northeast China under climate change(气候变化下东北地区农业绿水安全风险评估) 第一作者及…

Git 新手快速入门教程

一、什么是 Git 1. 何为版本控制 版本控制是一种记录文件变化的系统,可以跟踪文件的修改历史,并允许用户在不同版本之间进行比较、恢复或合并。它主要用于软件开发过程中管理代码的变更,但也可以应用于任何需要跟踪文件变更的场景。 版本控…

经典机器学习算法——决策树

优质博文:IT-BLOG-CN 树模型是机器学习中最常用的一类模型,包括随机森林、AdaBoost、GBDT(XGBoost和Lightgbm)等,基本原理都是通过集成弱学习器的即式来进一步提升准确度。这里的弱学习器包括线性模型和决策树模型&…

注意力机制中多层的作用

1.多层的作用 在注意力机制中,多层的作用通常指的是将注意力机制堆叠在多个层上,这在深度学习模型中被称为“深度”或“多层”注意力网络。这种多层结构的作用和实现过程如下: 1. **逐层抽象**:每一层都可以捕捉到输入数据的不同…

【python】启动一个公司级项目的完整报错和解决方案

启动一个项目对于新手都是不容易的事情 操作 打开项目 使用pyCharm打开python项目以后,先找main方法,一般在根目录有一个.py的文件 点进去以后会让你配置Python解释器 每个项目都有自己的一个虚拟环境,配置自己的解释器,可能…

Flink学习(七)-单词统计

前言 Flink是流批一体的框架。因此既可以处理以流的方式处理,也可以按批次处理。 一、代码基础格式 //1st 设置执行环境 xxxEnvironment env xxxEnvironment.getEnvironment;//2nd 设置流 DataSource xxxDSenv.xxxx();//3rd 设置转换 Xxx transformation xxxDS.…

Linux环境变量深度解析

文章目录 一、引言二、环境变量的基本概念1、环境变量的定义2、环境变量的作用与意义 三、环境变量的导入1、导入所需文件2、登陆时的导入 四、环境变量的设置方法1、查看环境变量的方式2、使用export命令临时设置环境变量3、修改配置文件以永久设置环境变量 五、命令行参数与环…

编写函数fun,它的功能是:利用以下所示的简单迭代方法求方程COS(X)-X=0的一个实根。

本文收录于专栏:算法之翼 https://blog.csdn.net/weixin_52908342/category_10943144.html 订阅后本专栏全部文章可见。 本文含有题目的题干、解题思路、解题思路、解题代码、代码解析。本文分别包含C语言、C++、Java、Python四种语言的解法完整代码和详细的解析。 题干 编写…

一个简单的记工tkinter窗口

代码分享: 导入datetime模块,用于获取当前日期 import datetime as da 导入csv模块,用于读写csv文件 import csv 导入tkinter模块,用于创建窗口和按钮 from tkinter import * 创建主窗口 appTk() 设置窗口大小为1048x2048&#xff0…

学习亚马逊云科技AWS云计算技术的三款官方免费3A游戏大作

玩3A大作免费电脑游戏,就能成为AWS云架构师、云开发大🐮?这么好的事尊的假的?小李哥今天就来给大家介绍,如何通过玩AWS官方的定制版虚拟人生、炉石传说和密室逃脱游戏学习AWS。这三个游戏完全免费,没有任何…