注意力机制的快速学习

注意力机制的快速学习

注意力机制

 将焦点聚焦在比较重要的事物上

  • 我(查询对象Q),这张图(被查询对象V)

  • 我看一张图,第一眼,就会判断那些东西对我而言比较重要,那些对于我不重要(去计算Q和V之间的事物重要度)

  • 重要度计算,其实就是计算相似度(更接近),点乘其实就是计算内积

  • Q,K = k1,k2,k3…kn,我们一般使用点乘方式

  • 通过点乘的方法计算Q和K里面的每一个事物的相似度,就可以拿到Q和k1的相似度s1,Q和k2的相似度s2,… 相似度sn

  • 最后,softmax(s1,s2,…,sn)就可以得到概率(a1,a2,…,an),然后就知道那个更加重要

在这里插入图片描述

  • 原先的V = (v1,v2,vn)

  • 最后进行一个汇总,当使用Q查询结束之后,Q已经失去它的使用价值,最后还是需要使用这张图片,但是现在的这张图片多了一些信息

  • (a1,a2,an)* (v1,v2,vn) = (a1v1,a2v2…)

  • 这样就得到一个新的V,新的V就包含了哪些更重要的信息,那些不重要的信息

  • 使用新的V代替原来的V

自注意力机制

  • 第一眼看一张图,不会把所有的信息都看完

在这里插入图片描述

  • QK相乘计算相似度,然后做一个scale(后面softmax的时候避免极端情况)

  • softmax得到概率

  • 自注意力机制的关键点在于,不仅仅是K=V=Q 来源于同一个X,三者是同一个源头

在这里插入图片描述

  • Q KV 的获取是通过三个参数Wq, Wk,Wv进行矩阵相乘得到的

  • 接下来的步骤和注意力机制一样

    在这里插入图片描述

在这里插入图片描述

  • z1就是达标thinking的新的向量表示

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/258149.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion XL on diffusers

Stable Diffusion XL on diffusers 翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Diffusion XL (SDXL) 是一个强大的图像生成模型,其在上一代 Stable Diffusion 的基础上主要做了如下优化:…

最新版IDEA专业版大学生申请免费许可证教学(无需学校教育邮箱+官方途径+非破解手段)

文章目录 前言1. 申请学籍在线验证报告2. 进入IDEA官网进行认证3. 申请 JB (IDEA) 账号4. 打开 IDEA 专业版总结 前言 当你进入本篇文章时, 你应该是已经遇到了 IDEA 社区版无法解决的问题, 或是想进一步体验 IDEA 专业版的强大. 本文是一篇学生申请IDEA免费许可证的教学, 在学…

Android之Binder原理剖析

一:Binder的全面介绍 binder的出现 George Hoffman当时任Be公司的工程师,他启动了一个名为OpenBinder 的项目,在Be公司被ParmSource公司收购后, OpenBinder 由Dinnie Hackborn继续开发,后来成为管理ParmOS6 Cobalt O…

全景万店通打造掌上智慧生活助手,助力店铺全景引流

随着网络经济的崛起,新一代的消费群体的消费习惯逐渐变得富有个性化,因此他们对于传统的营销方式具有视觉疲劳,传统广告的效果也越发微小,但是请明显来代言,成本又十分高昂,那么还有什么引流好方法呢&#…

无人机高空巡查+智能视频监控技术,打造森林防火智慧方案

随着冬季的到来,森林防火的警钟再次敲响,由于森林面积广袤,地形复杂,且人员稀少,一旦发生火灾,人员无法及时发现,稍有疏忽就会酿成不可挽救的大祸。无人机高空巡查智能视频监控是一种非常有效的…

element-ui upload组件中将file文件数据转成二进制流数据格式

方法一 handleBeforeUpload (file)const reader new FileReader()reader.readAsArrayBuffer(file)reader.onload async function (theFile) {const binary new Blob([theFile.target.result]) // 转成二进制流数据 即binary数据格式}}方法二 const aBlob new Blob([file],…

Ultimate VFX

Ultimate VFX 构建套件:

学习笔记9——JUC三种量级的锁机制

学习笔记系列开头惯例发布一些寻亲消息 链接:https://baobeihuijia.com/bbhj/contents/3/197325.html 多线程访问共享资源冲突 临界区:一段代码块存在对共享资源的多线程读写操作,称这段代码块为临界区 竞态条件:多个线程在临界…

基于jsp+servlet的图书管理系统

基于jspservlet的图书管理系统演示地址为 图书馆后台管理系统 用户名:mr ,密码:123 图书馆管理系统主要的目的是实现图书馆的信息化管理。图书馆的主要业务就是新书的借阅和归还, 因此系统最核心的功能便是实现图书的借阅和归还。此外,还需要提供图书…

如何排查rpc mount export: RPC: Timed out问题

文章目录 问题描述查看nfs服务是否运行正常如果以上都通过,尝试下面步骤 问题描述 我们将讨论您在 NFS 客户端上看到的 NFS 错误之一的故障排除。在尝试与 NFS 相关的命令时可以看到此错误,如下所示: 通常,当您看到此错误时,您也…

两个观察伦敦银关键点位的方法

所谓关键点位,就是伦敦银价格测试了之后容易出现走势转向的位置。例如银价上涨至某些关键点位后出现反转下跌,或者跌到某些关键点位后反转上涨。我们清楚关键点位对交易的重要性之后,就要开始了解怎么找到这些关键点位,下面我们就…

Xilinx FPGA——ISE时序约束“建立时间不满足”问题解决记录

一、现象 最近使用赛灵思的FPGA设计项目时,出现时序约束失效问题。 点进去发现如下: 一个始终约束没有生效,有多处报错。 二、原因 出现这个问题的原因是,建立时间不满足。 时序违例的主要原因是建立时间和保持时间不满足要求&a…