《神经网络入门》神经网络的思想 (一)

文章目录

  • 生物神经元的结构
  • 如何用数学建模神经元的工作模式
  • 神经网络的结构

在这里插入图片描述

我们知道神经网络是一个模拟人脑的数学建模,首先我们来了解一下生物神经元是怎么工作的。

人的大脑是由非常多神经元相互连接形成的网络构成的。一个神经元,可以从其他神经元接收信号,也可以向其他神经元发送信号。
神经元由细胞体、树突、轴突三个主要部分构成

生物神经元的结构

生物神经元,常简称为神经元,是人脑及动物神经系统中的基本单位。
这些细胞负责处理和传输信息,通过电信号和化学物质进行交流。

神经元的结构可以分为几个主要部分:细胞体、树突、轴突和突触。

  1. 细胞体(Soma)

    细胞体是神经元的“指挥中心”。其主要功能是维持细胞的生命活动,含有细胞核和其他细胞器。细胞核控制着细胞的基本功能和蛋白质的合成,是信息处理和决策的核心区域。

  2. 树突(Dendrites)

    树突是从细胞体延伸出的细长结构,它们如树枝一般分布,主要功能是接收来自其他神经元的信息。树突的表面布满了突触,能够捕捉并转换其他神经元释放的化学信号为电信号,传递给细胞体。

  3. 轴突(Axon)

    轴突是一个细长的管状结构,从细胞体延伸出来,其主要功能是传输电信号。在大多数神经元中,轴突的尾端分叉,与其他神经元的树突或细胞体形成连接。轴突可以非常长,达到几厘米甚至更长,使得神经系统能够在身体的不同部位迅速传递信息。

  4. 突触(Synapses)

    突触是神经元之间的连接点。在这些微小的间隙中,电信号无法直接跨越,因此神经元会通过释放化学物质(即神经递质)来传递信息。这些化学物质能够跨过突触间隙,被下一个神经元的树突上的受体捕捉,从而继续传递信号。
    在这里插入图片描述

    —————————————————————————————

在信息传递的过程中,由树突来接收其他神经元的信号,这个作为输入信号,然后树突传递给细胞体,细胞体会把从其他多个神经元传递进来的输入信号进行合并加工,然后通过轴突前端的突触传递给别的神经元,那么这里我们就需要了解一个非常重要的过程,就是神经元是如何对这些输入信号进行合并加工的。

如何用数学建模神经元的工作模式

当一个神经元从其他多个神经元接受到输入信号以后,如果这些信号之和比较小,没有超过神经元的阈值,这神经元的细胞体就会忽略接受的信号,不做出任何反应。如果信号适和足够大,超过了这个阈值的话,细胞体就会做出反应,向其他神经元传递信号,这个过程成为点火。而这里很有趣的地方是,这个输出信号的大小都是固定的,只要接收到的信号超出阈值,不管超出多少,神经元都只输出固定大小的信号。所以我们可以用0和1来表示点火的输出信号。

总结一下过程就是这三步,第一步,接收来自其他神经元的信号之和作为输入信号,第二步,判断输入信号是否超出阈值,超出就点火。第三步,输出数字信号0或1。
在这里插入图片描述

然后我们将这个过程进行数学化表示,用X来表示输入信号,用Y表示输出信号,无信号是为0,有信号是为1,然后用数学公式来表示神经元点火的这个判定条件。神经元是否点火取决于其他神经元的输入信号之和。但是呢,这里不是直接把它们加起来这么简单。因为不同的神经样有不同的权重,比方说一个人在打网球的时候,来自视觉神经的信号和来自听觉神经的信号对于大脑的处理来说肯定是有不同的权重的,所以输入信号之和我们应该加权求和,
在这里插入图片描述

其中W代表输入信号X对应的权重。当信号之和超过阈值的时候,点火输出信号1没超过就输出信号0,这个过程我们可以用一个单位阶越函数来表示,Z<0的时候输出0 Z>0的时候输出1,其中Z就等于刚才我们列出的这个式子,这个称为神经元的加权输入。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

然后我们再将以上神经元的工作进行数学上的一般化处理。首先呢,神经元的图示我们可以进行简化,用下面这个图来表示这种简化以后的神经元,
在这里插入图片描述
在这里插入图片描述

我们暂且称为神经单元或者人工神经元,和生物神经元区分开来。在生物神经元中,点火的式子是用这个单位阶越函数输出,不是0就是1,但在人工神经元中,我们可以换成别的函数。
这个
在这里插入图片描述

函数a是建模者可以自己去定义的,称为激活函数,这样单位阶越函数就是激活函数的其中一种。而在人工神经网络中,一个非常常用的激活函数是sigmoid函数,
在这里插入图片描述
这里e代表的就是自然底数,所以这个时候输出信号就不是0或者1了,而是<0<1的数值,这也是人工神经元区别于生物神经元的不同。
在这里插入图片描述
所以我们再看这一项,西塔,在这里插入图片描述

它代表神经元点火的阈值,这个值越小,说明神经元越容易兴奋,比较敏感。在数学中,我们这里-西塔换成+b,这样式子变得更漂亮,计算不容易出错,这个b就被称为偏置。
这样神经元我们就在数学上建模好了。大脑中的神经元就是由这种简单的结构和模式构成的,
在这里插入图片描述
但是当数十亿的这种简单的单元构成在一起时,最后呈现出的一种极其复杂的整体性质,比我们人脑的意识、思维、情感,这种现象在生物学中叫做emergece涌现,那我们模仿大脑的这种结构,会不会也涌现出这种智能呢?

神经网络的结构

结果大家已经非常清楚了,由神经单元组成的网络在人工智能领域已经取得了各种让人震惊的成就。我们只要把我们前面总结出的这种简单的神经元模型连接成网络状,就形成了神经网络。比方说chat GPT就是由数十亿的这种神经元模型构成的神经网络。网络的连接方法很多,后面我将主要介绍基础的阶层性神经网络和游戏发展而来的卷积神经网络。
我们先来看一个简单的例子,简单的理解了,复杂的就理解了,因为本质都是一样的。
在这里插入图片描述

我们建立一个神经网络,用来识别通过4×3像素读取的手写数字0和1。构成这个网络的各层分别是输入层、隐藏层、输出层,其中输入层12个神经单元用来读取12个像素信息,
在这里插入图片描述
输出层2个神经单元,其中Sigmoid函数作为激活函数,可以通过比较两个神经单元输出值的大小来判断手写数字是0还是1,

在这里插入图片描述

比方说,读取数字0的时候,上面的神经单元输出的值会比下面的值要大。输入层和输入层都很容易理解,再看最难理解的隐藏层,这里隐藏层的作用在于提取输入图像的特征。
在这里插入图片描述
比如我们看这几个图像都可以看成是数字0,对于人来说很容易判断,但是对于计算机来说就很困难了,因为答案是不标准的。那神经网络是如何进行判断的呢?
隐藏层有3个神经元ABC,他们会从输入层12个神经元那里获取信号大小,然后进行整合以后传递给输出神经元。
在这里插入图片描述
我们可以认为ABC有不同的喜好,他们分别喜欢图片中的模式ABC,于是相对应下面的12个输入神经元在他们这里就有不同的权重。
比方说模式A对应输入神经元4和7,这样对于A来说,4和7有更高的权重,
在这里插入图片描述
而5和8在B这里有更高的权重,6和9在C这里有更高的权重,而对于输出神经元0和1来说,A和C在0这里有更高的权重,B在1这里有更高的权重。
在这里插入图片描述
那假设我们读取这个手写数字0,
在这里插入图片描述
看到这个图像,4769都产生强烈的信号,
在这里插入图片描述
于是47向A传递了很强的信号,因为他们在A这里的权重很大,而69向C传递了很强的信号,而几乎就没有神经元给B传递很强的信号。由于A和C在0这里有非常高的权重,于是输出层的神经元0接收到了来自A和C很强的信号,神经元1接收到很弱的信号,输出0的信号大于输出1的信号,于是神经网络判断该图像的数字为0。
在这里插入图片描述

神经网络的工作原理就是这样的,并不复杂。但是我们如何确定各层神经元之间的权重大小呢?就是一件非常复杂的事情了。这个事情靠人类自己来做是不可能做到的,尤其是像chatGPT这样包含了数十亿个神经元的网络。那怎么办呢?那就提供大量数据,让机器自己来学习吧,此之为 机器学习噢。
在这里插入图片描述

(有空就写,敬请期待…)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/600531.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第45期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区&#xff0c;集成了生成预训练Transformer&#xff08;GPT&#xff09;、人工智能生成内容&#xff08;AIGC&#xff09;以及大语言模型&#xff08;LLM&#xff09;等安全领域应用的知识。在这里&#xff0c;您可以找…

萨科微半导体

萨科微半导体的产品包括二极管三极管、功率器件、电源管理芯片等集成电路三大系列&#xff0c;可以平替换英飞凌、安森美、意法半导体、富士、三菱、科锐cree等品牌的产品。在宋仕强总经理的带领下&#xff0c;萨科微半导体&#xff08;www.slkoric.com&#xff09;将加速实现“…

水泥5G智能制造工厂数字孪生可视化平台,推进水泥行业数字化转型

水泥5G智能制造工厂数字孪生可视化平台&#xff0c;推进水泥行业数字化转型。水泥5G智能制造工厂数字孪生可视化平台&#xff0c;是水泥行业数字化转型的关键推手。数字孪生平台运用先进的信息技术和数字化手段&#xff0c;实现水泥生产过程的数字化模拟、可视化监控和智能化管…

全自动ai生成视频MoneyPrinterTurbo源码 在线ai生成视频源码

内容目录 一、详细介绍二、效果展示1.部分代码2.效果图展示 三、学习资料下载 一、详细介绍 现在短视频这么火爆&#xff0c;流量就是金钱。 如果能全自动的生成短视频&#xff0c;是不是很容易带来流量&#xff0c;赚到马内。 MoneyPrinter 这个开源项目就可以自动生成短视…

数据库引论:3、中级SQL

3.中级SQL 一些更复杂的查询表达 3.1 连接表达式 拼接多张表的几种方式 3.1.1 自然连接 natural join&#xff0c;自动连接在所有共同属性上相同的元组 join… using( A 1 , A 2 , ⋯ A_1,A_2,\cdots A1​,A2​,⋯):使用括号里的属性进行自然连接&#xff0c;除了这些属性…

mfc140u.dll丢失的解决方法,解决mfc140u.dll丢失的弹窗问题

在使用电脑的时候是不是遇到过mfc140u.dll文件丢失的错误弹窗的情况&#xff0c;出现这样的问题时什么情况&#xff0c;有什么办法解决&#xff0c;今天这篇文章将带着大家去了解mfc140u.dll丢失的解决办法。帮助大家快速有效的解决mfc140u.dll文件。 一.解决mfc140u.dll丢失的…

visual studio 2017开发QT框架程序

1. 配置开发环境 首先创建项目 进入到项目后&#xff0c;右键点击项目点击属性&#xff0c;配置如下&#xff1a;

dockerhub右键快速搜索脚本

Chrome 浏览器扩展的后台脚本&#xff0c;用于创建右键菜单项&#xff0c;并根据用户的操作在新的标签页中打开 Docker Hub 网站或者进行搜索。 // 创建右键菜单项&#xff0c;用于打开 Docker Hub 网站 chrome.contextMenus.create({id: search-home, // 菜单项的唯一标识符t…

代码随想录算法训练营第48天|198.打家劫舍|213.打家劫舍II| 337.打家劫舍III

代码随想录算法训练营第48天|198.打家劫舍|213.打家劫舍II| 337.打家劫舍III 今天就是打家劫舍的一天&#xff0c;这个系列不算难&#xff0c;大家可以一口气拿下。 198.打家劫舍 视频讲解&#xff1a;https://www.bilibili.com/video/BV1Te411N7SX https://programmercarl.c…

【记录】LangChain|llama 2速通版

官方教程非常长&#xff0c;我看了很认可&#xff0c;但是看完了之后呢就需要一些整理得当的笔记让我自己能更快地找到需求。所以有了这篇文章。【写给自己看的&#xff0c;里面半句废话的解释都没有&#xff0c;如果看不懂的话直接看官方教程再看我的】 我是不打算一开始就用…

腾讯云向量数据库——RAG七天入门课笔记

目录 前言一、RAG介绍1-0、引言-大语言模型的不足1-1、向量数据库定义1-2、工作原理1-3、优点1-4、与传统数据库的区别1-5、RAG应用痛点 二、数据处理的难点——解析和拆分2-1、复杂文档格式-解析过程中的问题2-2、复杂文档解决流程2-3、Chunk拆分的问题以及如何改进 三、相似性…

【redis数据同步】redis-shake数据同步全量+增量

redis-shake数据同步 redis-shake是基于redis-port基础上进行改进的一款产品。它支持解析、恢复、备份、同步四个功能。以下主要介绍同步sync。 恢复restore&#xff1a;将RDB文件恢复到目的redis数据库。备份dump&#xff1a;将源redis的全量数据通过RDB文件备份起来。解析de…