【脑电信号处理与特征提取】P7-涂毅恒:运用机器学习技术和脑电进行大脑解码

运用机器学习技术和脑电进行大脑解码

科学研究中的大脑解码

比如2019年在Nature上一篇文章,来自UCSF的Chang院士的课题组,利用大脑活动解码语言,帮助一些患者恢复语言功能。
在这里插入图片描述

大脑解码的重要步骤

大脑解码最重要的两步就是信号采集信号解码 ,信号采集就是所说的脑电技术,信号解码就是机器学习的方法。
在这里插入图片描述

机器学习-基本流程

在这里插入图片描述

机器学习-数据采集

  • 数据采集:确保训练和测试数据集充足且具有代表性
    • 充足的数据:确保存在足够多的数据来训练分类器
    • 有代表的数据:确保有意义的变化都可以从训练和测试数据采样得到

机器数据-预处理

  • 预处理:对获取的数据进行调整,金尽可能消除各种来源的噪声
    • 滤波(去除噪声):
      • 有限冲激响应FIR/无限冲激响应IIR滤波
      • 自适应滤波
      • 空间滤波(独立成分分析)等
    • 剔除异常值(outlier removal)
    • 归一化(normalization)

预处理-剔除异常值

异常值(outlier):数值上与其他数据距离过于远的数据,它将极大地影响正确分类器的训练。
比如:被EOG干扰的EEG试次可能是异常值(在幅度上差别极大)。
在这里插入图片描述
典型方法:设置一个阈值,如果样本值大于阈值,则可以将该样本视为异常值。
例如:3标准差原则,剔除超过样本均值3个标准差的样本值(仅局限于正态或近似正态分布的样本)。
在这里插入图片描述

预处理-归一化

  • 归一化(特征缩放):由于原始数据的取值范围变化很大,如果不进行归一化,某些分类器无法正常工作。
  • 例如,大多数分类器会计算两个样本之间的距离。如果其中一个特征的范围很广,则计算的距离将主要受该特定特征的影响。因此需要对所有特征的范围进行归一化,使每个特征对最终距离的贡献成比例

归一化的方法有两种:标准化(standardization)再缩放(re-scaling)
在这里插入图片描述
还有一种情况可采用对数变换:当特征值存在较大差异的时候,使用对数变换来减小特征值的动态范围。
在这里插入图片描述

机器学习-特征提取和选择

当对正眼闭眼状态的EEG进行分类时

  • 重要特征为枕区的 α \alpha α频段能量
  • 冗余特征可能为枕区不同通道的 α \alpha α频段能量
  • 无用特征可能为其它频段其它脑区的EEG能量

Q: 为什么要进行特征提取和选择?
A: 因为数据维数过高会面临无法找到重要特征和过拟合问题,所以需要选择有用的特征进行训练。这里用到的方法叫做降维。

在这里插入图片描述

降维

降维(dimension reduction):主要是由脑电研究中面临的“大数据”挑战所驱动的。

  • 降维的重要性
    少量但信息量大的特征可以显著减少
    • 分类算法的复杂度
    • 运行算法时对时间以及机器的需求
    • 过拟合出现的可能性
  • 特征提取和特征选择都是降维过程

无监督降维-主成分分析

  • 最常见的无监督降维方法为主成分分析(Principal Component Analysis,PCA)

  • PCA通常用于高维特征投影到底维空间中,从而有效地降低维数

  • 在数学上,PCA使用正交变换将相关变量的一组观测值转换为一组被称为主成分(Principal Components,PCs)的线性不相关变量。

  • 主成分分析将观测到的数据转换到一个新的坐标系中,这样对数据进行投影后得到的最大方差就会落在第一个坐标上(即主成分),第二大方差落在第二个坐标上,以此类推。
    在这里插入图片描述
    如何理解选择方差大的特征呢? 因为PCA的目的就是选择重要的特征,重要的特征应该能够区别不同样本,方差大意味着样本在这一个特征下的区分度大,所以我们选择方差大的特征作为主成分。

  • 主成分分析是一种强大的降维工具。

  • 如果一个主成分的方差很小,从数据中删除这个成分后,我们只损失了少量的信息。

  • 假设我们只保留L个主成分,那么新数据将只有L列,但却包含了原始数据中绝大多数的信息
    在这里插入图片描述
    算法如下:
    在这里插入图片描述

  • 主成分分析可应用于脑电分析,以降低以下域上的维数

    • 时间(相邻时间点信号幅度近似)
    • 频率(相邻频率点功率值相似)
    • 空间(相邻通道的脑电相似程度高)
  • 原因:脑电信号在这些域内包涵冗余特征

有监督降维

有监督的降维:利用类标签来确保高纬度数据可以被映射到底维空间,且不同的类可以在这个空间中被很好的区分。
在这里插入图片描述
在这里插入图片描述

机器学习-模型选择与训练

多数分类器为二分类器(输出两个类别),但也有一些分类器允许使用两个以上的类。
多分类:将样本分为L类,其中L>2。
通常来说,多分类是利用常用的二分类器通过不同的策略来实现的:

  • 一对多(One-vs.-Rest)
  • 一对一(One-vs.-One)

模型选择与训练-多分类

在这里插入图片描述
脑电分析中常用的分类器

  • 支持向量机
  • 贝叶斯决策
  • 决策树与随机森林
  • 聚类
  • 神经网络与深度学习

模型选择与训练-支持向量机

  • 支持向量机(Support Vector Machine,SVM)是一类有监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面
    在这里插入图片描述

模型选择与训练-贝叶斯决策

  • 贝叶斯决策(Bayesian Decision Theory)是概率框架下实施的基本方法。对于分类任务来说,在所有相关概念都已知的理想情形下,贝叶斯决策论考虑如何基于这些概念和误判损失选择最优的类别标记。
    在这里插入图片描述

模型选择与训练-决策树与随机森林

  • 决策树(Decision Tree)是一类常见的机器学习方法。顾名思义,决策树是基于书结构来进行决策的。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶节点则对于从根节点到该叶节点所经历的路径所表示的对象的值。
    在这里插入图片描述

模型选择与训练-聚类

  • 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
    在这里插入图片描述

模型选择与训练-神经网络与深度学习

在这里插入图片描述

机器学习-评估

利用训练数据完成模型选择和训练后,需要在测试数据进行广泛化性能评估
在这里插入图片描述
评估的方法之一是交叉验证
在这里插入图片描述
评估的性能度量指标
在这里插入图片描述
所以需要其它指标来进一步评估分类器性能
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/452155.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pycharm 关闭/退出烦人的Pytest模式

Pycharm 遇到:Run Python tests in ***.py ,但很多时候我们并不需要,真心烦人! 如何解决: 1 打开File-Settings (图片是新版界面,旧版同样操作) 2 Tools 中的Python Integrated Tools 在Tes…

impala与kudu进行集成

文章目录 概要Kudu与Impala整合配置Impala内部表Impala外部表Impala sql操作kuduImpala jdbc操作表如果使用了Hadoop 使用了Kerberos认证,可使用如下方式进行连接。 概要 Impala是一个开源的高效率的SQL查询引擎,用于查询存储在Hadoop分布式文件系统&am…

新开发板-正点原子的rk3568

有好长一段时间没有更新博客了,上次更新还是在上次...哈哈开个玩笑,上次stm32f407的定时器还没写完,就备战期末去了(电信学院,你懂的),一直没更新,原因是我实习去了,在忙…

【算法】{画决策树 + dfs + 递归 + 回溯 + 剪枝} 解决排列、子集问题(C++)

文章目录 1. 前言2. 算法例题46.全排列78.子集 1. 前言 dfs问题 我们已经学过,对于排列、子集类的问题,一般可以想到暴力枚举,但此类问题用暴力解法 一般都会超时,时间开销过大。对于该种问题,重点在于尽可能详细的 画…

父类之王“Object”类和内部类

👨‍💻作者简介:👨🏻‍🎓告别,今天 📔高质量专栏 :☕java趣味之旅 欢迎🙏点赞🗣️评论📥收藏💓关注 💖衷心的希…

学术研究新突破:发现新型相变存储器

斯坦福大学的研究人员开发出了一种新型相变存储器,该存储器有望帮助计算机更快、更高效地处理大量数据。在最近发表于《自然通讯》的一篇论文中,研究人员详细介绍了这项技术,表明一种新材料可能会使基于电阻高低状态切换以创建计算机数据“0”…

【实战】阿里智能编码助手通义灵码

文章目录 前言技术积累通义灵码是什么?Copilot是什么?通义灵码主要功能通义灵码有哪些优势?通义灵码支持语言/工具通义灵码接入方式通义灵码帮助中心 实战演示安装插件行/函数级实时续写自然语言生成代码代码优化单元测试生成代码注释生成解释…

【数据结构]排序算法之插入排序、希尔排序和选择排序

简单不先于复杂,而是在复杂之后。 文章目录 1. 排序的概念及其运用1.1 排序的概念1.2 排序运用1.3 常见的排序算法 2. 常见排序算法的实现2.1 插入排序2.1.1 基本思想2.1.2 直接插入排序2.1.3 希尔排序(缩小增量排序) 2.2. 选择排序2.2.1 基本…

挑战杯 python 爬虫与协同过滤的新闻推荐系统

1 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 python 爬虫与协同过滤的新闻推荐系统 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分工作量:3分创新点:4分 该项目较为新颖&…

AI赋能:人工智能技术在海外网红营销中的巧妙应用

随着科技的飞速发展,人工智能技术正日益渗透到各个领域,其中包括海外网红营销。在数字化时代,海外网红已经成为品牌推广的有力工具,而人工智能的应用更是为这一领域带来了智能化升级。本文Nox聚星将和大家探讨人工智能在海外网红营…

Onlyoffice8.0功能测评:一款强大的多端文档处理工具

OnlyOffice是一款在线的office工具,可以理解为我们平常使用的windows中的office,其支持多种类型的文档进行在线编辑。[OnlyOffice官网](ONLYOFFICE - 企业在线办公应用软件 | ONLYOFFICE) Onlyoffice 可以在 Windows,MacOS, Android 上运行&…

flutter抓包绕过

lutter的证书校验 起因: 最近工作上让做个app的复测,把apk发我后,开始尝试挂代理抓包,结果发现抓不到 为是证书没弄好,想着前几天不是刚导入了吗(雾)。又重新导入了下还是不行。然后各种lsp模…