MATLAB Deep learning

在这里插入图片描述

文章目录

  • Chapter 1: Machine Learning
    • 存在的问题
      • 过拟合Overfitting
      • 解决过拟合 regularization and validation
        • regularization 正则化
        • validation 验证
    • 机器学习的类型
      • 有监督学习
        • 分类Classification
        • 回归Regression
      • 无监督学习
        • 聚类
      • 强化学习
  • Chapter 2: Neural Network
    • 神经网络的结点Nodes of a Neural Network
    • 神经网络层Layers of Neural Network
    • 神经网络的监督学习Supervised Learning of a Neural Network
    • 单层神经网络的训练Training of a Single-Layer Neural Network
      • Delta Rule 德尔塔定律
  • Chapter 3: Training of Multi-Layer Neural Network
  • Chapter 4: Neural Network and Classification
  • Chapter 5: Deep Learning
  • Chapter 6: Convolutional Neural Network

Chapter 1: Machine Learning

在这里插入图片描述

  • 深度学习是一种机器学习,而机器学习是一种人工智能。
  • 机器学习的本质:机器学习是一种从“数据”中找到“模型”的技术。在这里,数据的字面意思是指文档、音频、图像等信息。这个“模型”是机器学习的最终产物。

在这里插入图片描述

  • 机器学习的创建是为了解决分析模型几乎不可用的问题。机器学习的主要思想是在方程和定律不好时使用训练数据实现一个模型.

在这里插入图片描述

  • 但是由于训练的数据与得出的模型是存在不同的

在这里插入图片描述

存在的问题

过拟合Overfitting

  • 训练数据中始终会存在异常点,这些异常点会影响边界的分类,机器识别是不能识别这些异常点的,这就会造成,当你将训练数据全部考虑的时候,就会得到通用性较低的模型

在这里插入图片描述

在这里插入图片描述

  • 以上面的图为例子:对于图一,似乎拟合的十分成功,但是对于应用在图二的身上的正确性就有待确认

解决过拟合 regularization and validation

regularization 正则化
  • 正则化是一种尽可能简单地试图构建模型结构的数值方法。简化的模型可以在较小的性能代价下避免过拟合的影响。
validation 验证
  • 验证是一个保留一部分训练数据并使用其来监控性能的过程。验证集不用于培训过程。当训练后的模型对保留数据输入的性能水平较低时,模型被过拟合。在这种情况下,我们将修改模型,以防止过拟合。

在这里插入图片描述

  • 机器学习的验证的过程
    1.将训练数据分为两组:一组用于训练,另一组用于验证。根据经验,训练集与验证集的比率是8:2。
    2.用训练集来训练模型。
    3.使用验证集来评估模型的性能。
    a.如果该模型的表现令人满意,则完成训练。
    b.如果性能不能产生足够的结果,则修改模型并重复步骤2中的过程。
  • 交叉验证:交叉验证是验证过程中的一个细微变化。它仍然将训练数据分成组进行训练和验证,但不断改变数据集。交叉验证不是保留最初的划分集,而是重复对数据的划分。这样做的原因是,当模型是固定的时,模型也会过度拟合。由于交叉验证保持了验证数据集的随机性,它可以更好地检测模型的过拟合。

在这里插入图片描述

机器学习的类型

  • 根据训练方法,这些机器学习技术可以分为三种类型
    有监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)

在这里插入图片描述

在这里插入图片描述

有监督学习

  • 有监督学习步骤:
    1.选择一个练习问题。运用现有的知识来解决这个问题。比较一下答案和解决方案。
    2.如果答案是错误的,请修改当前的知识。
    3.对所有的练习问题,重复步骤1和步骤2。
  • 在监督学习中,每个训练数据集都应该由输入对和正确的输出对组成。正确的输出是模型应该为给定的输入而产生的输出。
  • 在监督学习中,学习就是对模型进行一系列修正,以减少相同输入的正确输出和模型输出之间的差异。
分类Classification
  • 分类问题的重点是从实际上查找数据所属的类。
    垃圾邮件过滤服务➔分类邮件定期或垃圾邮件
    数字识别服务➔分类数字图像到0-9
    人脸识别服务➔人脸图像分类的注册用户之一
  • 监督学习需要输入和正确的输出的训练数据。同样,分类问题的训练数据是:{ 输入,类别}
  • 数据对用类代替了与输入对应的正确输出。
  • 例子:我们希望机器学习回答的模型是用户的输入坐标(X,Y)属于这两个类(∆和)中的哪一个

在这里插入图片描述

  • 那么输入的数据的形式就是
    在这里插入图片描述
回归Regression
  • 回归并不能决定类别。相反,它估计了一个值
  • 例如,如果您有年龄和收入的数据集(用a表示),并且想要找到按年龄估计收入的模型,它就变成一个回归问题

在这里插入图片描述

  • 那么就有输入的数据的形式就是{ 年龄 ,收入 }

在这里插入图片描述

无监督学习

  • 相比之下,无监督学习的训练数据只包含没有正确输出的输入
  • 无监督学习通常用于研究数据的特征和对数据进行预处理。这个概念类似于一个学生,他只是通过构造和属性来分类问题,而不学习如何解决它们,因为没有已知的正确输出
聚类
  • 聚类是无监督学习的代表性应用之一。它调查了个体数据的特征,并对相关数据进行了分类。这很容易混淆聚类和分类,因为它们的结果是相似的。虽然它们产生相似的输出,但它们是两种完全不同的方法。我们必须记住,聚类和分类是完全不同的术语。当你遇到聚类这个术语时,只要提醒自己它关注的是无监督学习

强化学习

  • 强化学习采用输入、一些输出和等级作为训练数据。它通常在需要最佳交互时使用,如控制和游戏玩法。

Chapter 2: Neural Network

  • 我们用神经网络代替模型,用学习规则代替机器学习。在神经网络的背景下,确定模型(神经网络)的过程被称为学习规则

在这里插入图片描述

神经网络的结点Nodes of a Neural Network

  • 神经网络模仿了大脑的作用机制。由于大脑是由许多神经元的连接组成的,所以神经网络是由节点的连接构成的,这些节点是与大脑中的神经元相对应的元素。神经网络利用权重值来模拟神经元的关联,这是大脑最重要的机制。

在这里插入图片描述

  • 神经网络的结点一般有输入,权重,偏差,输出组成
  • 神经网络的信息以权值和偏差的形式存储起来

在这里插入图片描述

  • 到达结点的输入是全部输入的加权和以及加上偏差(权重越大的结点对该结点的影响更大)

在这里插入图片描述

  • 那么总的式子是可以用矩阵表示的

在这里插入图片描述

  • 获得的输入会经过激活函数,然后输出(激活函数决定了结点的行为)

在这里插入图片描述

  • 那么就会有一个总的一个结点的行为

在这里插入图片描述

神经网络层Layers of Neural Network

  • 根据节点的连接方式,可以创建多种神经网络。最常用的神经网络类型之一是节点分层结构。

在这里插入图片描述

  • 正方形节点组称为输入层。输入层的节点仅仅作为将输入信号传输到下一个节点的通道。因此,他们不计算加权和和激活函数。这就是它们用正方形表示并与其他圆形节点不同的原因。
  • 最右边的节点组被称为输出层。从这些节点得到的输出成为神经网络的最终结果。
  • 位于输入层和输出层之间的图层被称为隐藏层。它们被赋予这个名字是因为它们不能从神经网络的外部访问。
  • 只有输入层和输出层,这被称为单层神经网络
  • 当隐藏层添加到单层神经网络时,就产生多层神经网络。因此,多层神经网络由输入层、隐层和输出层组成。
  • 具有单一隐藏层的神经网络被称为浅层神经网络或普通神经网络
  • 一个包含两个或两个以上隐藏层的多层神经网络被称为深度神经网络

在这里插入图片描述
在这里插入图片描述

  • 分层神经网络的工作:分层神经网络中,信号进入输入层,通过隐藏层,然后通过输出层离开。在这个过程中,信号一层地推进。换句话说,一层上的节点同时接收信号,并同时将处理后的信号发送到下一层

在这里插入图片描述

  • 这里我们假设激活函数是一个线性函数

在这里插入图片描述
在这里插入图片描述

  • 那么就有第一个结点的输出是 6 ,下面的那个隐藏结点的输出是 11
  • 利用矩阵计算
    在这里插入图片描述

在这里插入图片描述

  • W 是权重矩阵,x 是输入向量,b 是偏差向量
    在这里插入图片描述
  • 那么对于下一层的计算:
    在这里插入图片描述
  • 可以说除了输入来自隐藏层,计算的过程是一样的
  • 在该例子中,(由于我们使用了线性的激活函数)多层神经网络是可以看成一个单层神经网络

在这里插入图片描述

神经网络的监督学习Supervised Learning of a Neural Network

  • 神经网络的监督学习过程:
    1.使用足够的值初始化权重。
    2.从训练数据中“输入”,格式化为{输入,正确输出},然后输入神经网络。从神经网络中获得输出,并从正确的输出中计算误差。
    3.调整重量以减少误差。
    4.对所有训练数据重复步骤2-3
    (个人觉得就是要提取输入与正确的输出,然后对权重进行相对应的调整)
  • 与监督学习的联系与区别:这些步骤基本上与“机器学习类型”部分的监督学习过程相同。这是有意义的,因为有监督学习的训练是一个修改模型的过程,以减少正确的输出和模型的输出之间的差异。唯一的区别是,对模型的修改变成了神经网络的权值的变化。
    在这里插入图片描述

单层神经网络的训练Training of a Single-Layer Neural Network

Delta Rule 德尔塔定律

  • 根据给定的信息来修改权值的系统方法称为学习规则

Chapter 3: Training of Multi-Layer Neural Network

Chapter 4: Neural Network and Classification

Chapter 5: Deep Learning

Chapter 6: Convolutional Neural Network

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/410408.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【iOS】数据存储方式总结(持久化)沙盒结构

在iOS开发中,我们经常性地需要存储一些状态和数据,比如用户对于App的相关设置、需要在本地缓存的数据等等,本篇文章将介绍六个主要的数据存储方式 iOS中数据存储方式(数据持久化) 根据要存储的数据大小、存储数据以及…

cookie和session的工作过程和作用:弥补http无状态的不足

cookie是客户端浏览器保存服务端数据的一种机制。当通过浏览器去访问服务端时,服务端可以把状态数据以key-value的形式写入到cookie中,存储到浏览器。浏览器下次去服务服务端时,就可以把这些状态数据携带给服务器端,服务器端可以根…

LaWGPT安装和使用教程的复现版本【细节满满】

文章目录 前言一、下载和部署1.1 下载1.2 环境安装1.3 模型推理 总结 前言 LaWGPT 是一系列基于中文法律知识的开源大语言模型。该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练&am…

【Linux进程篇】进程地址空间(2)

【Linux进程篇】进程地址空间(2) 目录 【Linux进程篇】进程地址空间(2)进程地址空间的再次理解什么是虚拟地址?fPIC与地址无关码是什么?为什么动态库里有,静态库里没有呢? 作者&…

高考志愿填报系统开发技术语言选择总结

开发高考志愿填报系统,需要考虑到系统的稳定性、安全性、易用性以及数据准确性。以下是针对高考志愿填报系统的技术方案选择建议: 1.后端技术:可以使用Python、Java、PHP等后端语言进行开发,考虑到易用性和开发效率,可…

银行数据仓库体系实践(2)--系统架构

UML对系统架构的定义是:系统的组织结构,包括系统分解的组成部分,它们的关联性,交互,机制和指导原则,例如对系统群就是定义各子系统的功能和职责,如贷款系统群可能分为进件申请、核额、交易账务、…

C++力扣题目669--修剪二叉搜索树

给你二叉搜索树的根节点 root ,同时给定最小边界low 和最大边界 high。通过修剪二叉搜索树,使得所有节点的值在[low, high]中。修剪树 不应该 改变保留在树中的元素的相对结构 (即,如果没有被移除,原有的父代子代关系都应当保留)。…

iOS UI掉帧和卡顿优化解决方案记录

UI卡顿原理 在 VSync 信号到来后,系统图形服务会通过 CADisplayLink 等机制通知 App,App 主线程开始在 CPU 中计算显示内容,比如视图的创建、布局计算、图片解码、文本绘制等。随后 CPU 会将计算好的内容提交到 GPU 去,由 GPU 进行…

JVM内存模型/运行时数据区域

java虚拟机管理这块内存,所以我们也叫运行时数据区域 总览 这里按线程是否共享来分类,所谓线程不共享就是每个线程里面都会配一套 程序计数器 栈, 互相不干涉。 而方法区和堆是线程所有共享 意味着只有一个(这里注意堆是实际概念…

数学建模-预测人口数据

目录 中国09~18年人口数据 创建时间 绘制时间序列图 使用专家建模器 得到结果 预测结果 残差的白噪声检验 中国09~18年人口数据 创建时间 路径:数据-> 定义日期和时间 绘制时间序列图 使用专家建模器 看看spss最终判断是那个模型最佳的契合 得到结果 预…

美国CEC能效认证测试简介

CEC能效认证测试简介 CEC是美国加利福尼亚州能源委员会(California Energy Commis-sions)的简称,它的职责是使能源市场朝着良性竞争的方向发展。该组织从1976年开始推行的加州电器能效法规(Appliance Efficiency Regul-ation&…

二叉树【Java】

文章目录 一、树型结构二、二叉树2.1概念2.2两种特殊的二叉树2.3二叉树的性质2.4二叉树的遍历 三、二叉树的基本操作3.1获取树中节点的个数3.2获取叶子节点的个数3.3获取第K层节点的个数3.4获取二叉树的高度3.5检测值为value的元素是否存在 一、树型结构 树是一种非线性的数据…