P51 各式各样的神奇的自注意力机制

在这里插入图片描述

计算量大

当input sequence 很长时,计算量特别大

  • self-atttention 至少一个大模型的一部分
  • 当input sequence 很长时,主要运算来自self - attention, 加快 self attention ,才能有明显的加快速度
  • 在这里插入图片描述

变形

  1. local attention
    只计算左右两个位置的 attention weight, 其他位置设为0
    缺陷: 只看到某个小范围的咨询
    那岂不是跟CNN一样
    计算快,但是效果不一定好

在这里插入图片描述
2. stride attention

如看两个间隔一个, 或者看一个间隔一个
在这里插入图片描述
3. global attention

在这里插入图片描述

在这里插入图片描述
所有的 attention 变形一起上

在这里插入图片描述

直接估计在 atteontion matrix 里哪些位置数值大,哪些小,小的直接设为0
在这里插入图片描述

  • 怎么快速预估attention weights?
    (聚类,根据相似性)
    在这里插入图片描述
    在这里插入图片描述

是否需要所有的 attention matrix

在这里插入图片描述
选择有代表性的K
在这里插入图片描述

如何选择有代表性的K

CNN : 长sequence 变成 短 sequence
Linformer
在这里插入图片描述
在这里插入图片描述
Q K 维数需要一样,V不一定

转变计算顺序 矩阵相乘的顺序,计算量不一样
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/286716.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

八大在线PS工具,你不能错过的编辑利器

即时设计 即时设计是一款优秀的在线ps网页版替代工具,具有各种硬件设备的标准尺寸,可以直接在编辑器中创建不同设备(手机、平板电脑、电脑等)尺寸的画板。)并预览您的设计效果。 即时设计支持互动事件演示,丰富的过渡动画,各种渐…

python接口自动化测试--requests使用和基本方法封装

之前学习了使用jmeterant做接口测试,并实现了接口的批量维护管理(大概500多条用例),对“接口”以及“接口测试”有了一个基础了解,最近找了一些用python做接口测试的资料,一方面为了学习下如何使用python进行接口测试(如何做出一个…

[每周一更]-(第29期):mac小白入手“MacBook Pro M2“各种问题指南

作为使用15年重度Windows用户,从2008年初中毕业接触电脑,到2012年上大学从事计算机相关学习工作,一直都是忠实的Windows使用者,使用的系统:Microsoft Windows XP、7、10、11, 体验到系统的兼容性和灵活的注册表使用&am…

dbeaver导出数据为excel格式

dbeaver导出excel 目前数据的可选择只有这几种 恰好没有我们需要的excel模式,而我们需要数据一般都需要excel的 所以我们可以通过以下步骤得到我们的excel格式的数据集: 1.直接选csv模式,至于csv有陌生的小伙伴可以理解:CSV(Comma-Separated Values)是…

机器学习之线性回归(Linear Regression)

概念 线性回归(Linear Regression)是机器学习中的一种基本的监督学习算法,用于建立输入变量(特征)与输出变量(目标)之间的线性关系。它假设输入变量与输出变量之间存在线性关系,并试图找到最佳拟合线来描述这种关系。 在简单线性回归中,只涉及两个变量:一个是自变量…

internet download manager 6.42怎么删除卸载,2024最新idm卸载不干净怎么解决

internet download manager 6.42简称为IDM,这是一款非常好用的下载软件,很多小伙伴都在使用。如果后续我们不再需要使用该软件,小伙伴们知道具体该如何将其卸载掉吗,其实卸载方法是非常简单的,只需要进行几个非常简单的…

基于paddlepaddle的FPS最远点采样

什么是FPS最远点采样? 最远点采样(Farthest Point Sampling,FPS)是一种常用的采样算法,主要用于点云数据(如激光雷达点云数据、分子坐标等)的采样。 为了方便解释,定义一下待采样点…

【Spring】11 EnvironmentAware 接口

文章目录 1. 简介2. 作用3. 使用3.1 创建并实现接口3.2 配置 Bean 信息3.3 创建启动类3.4 启动 4. 应用场景总结 Spring 框架为开发者提供了丰富的扩展点,其中之一就是 Bean 生命周期中的回调接口。本文将着重介绍一个与环境(Environment)相关…

JVM调优排错专题

JVM调优排错专题 1 打开MAT报错 1 打开MAT报错 下载了linux版本的 MAT 软件,1.15.0版本。 下载地址:https://eclipse.dev/mat/downloads.php 运行时报错了。 错误截图 报错日志 wittasus:/usr/develop/mat$ ./MemoryAnalyzer Unrecognized option:…

如何实现TAB切换时按钮变换样式

实现TAB切换时按钮变换样式的方法 当鼠标移动到TAB标签按钮时,按钮样式发生改变(红底白色加粗字体),当点击按钮切换显示内容后,按钮样式发生改变(黄底黑色加粗字体) 选中按钮“作业批阅结果”,右键>>编辑按钮形状>>编…

黑盒测试中关键截图如何打点

黑盒测试中关键截图如何打点Android黑盒测试过程中如何进行有效的打点是我们经常遇到的问题,我们一般会在脚本内部进行数据打点,也可以使用其他进程录屏或截图。那我们如何选取合适的方式进行打点记录呢?下图是对常用打点方式的统计&#xff…

嵌入式软件测试(黑盒测试)---三年嵌入式软件测试的理解

文章内容为本人这三年来在嵌入式软件测试(黑盒)上的一些积累吧,说起来也挺快的,毕业三年的时间就这样过去了,在两家公司工作过(现在这家是第二家),这几年的测试项目基本都是围绕着嵌…