transformer Position Embedding

这是最近一段很棒的 Youtube 视频,它深入介绍了位置嵌入,并带有精美的动画:

Transformer 神经网络视觉指南 -(第 1 部分)位置嵌入

让我们尝试理解计算位置嵌入的公式的“sin”部分:

在此输入图像描述

这里“pos”指的是“单词”在序列中的位置。P0指的是第一个词的位置embedding;“d”表示单词/令牌嵌入的大小。在此示例中,d=5。最后,“i”指的是嵌入的 5 个单独维度中的每一个维度(即 0、1、2、3、4)

虽然“d”是固定的,但“pos”和“i”会变化。让我们尝试理解后两者。

“pos”

在此输入图像描述

如果我们绘制一条正弦曲线并改变“pos”(在 x 轴上),您将在 y 轴上得到不同的位置值。因此,具有不同位置的单词将具有不同的位置嵌入值。

但有一个问题。由于“sin”曲线间隔重复,您可以在上图中看到,P0 和 P6 具有相同的位置嵌入值,尽管位于两个非常不同的位置。这就是方程中“i”部分发挥作用的地方。

“i”

在此输入图像描述

如果改变上面等式中的“i”,您将得到一堆频率不同的曲线。读取不同频率下的位置嵌入值,结果会在 P0 和 P6 的不同嵌入维度上给出不同的值。

 加上这个位置编码,会破坏原来的“特征表达”里面的数据含义吗?

  1. 空间编码是以加法的方式直接加入到初始表达中,不改变原始表达的值。
  2. 初始表达代表每个关节的抽象特征,空间编码代表每个关节的空间位置信息。两者在语义上是不同的,直接加法不会使原表达失效。
  3. 加法之后,初始表达中关键点自己的特征被保留了下来,同时新增了空间位置的先验信息。
  4. 对注意力机制来说,有了空间位置编码,可以更区分不同关键点的表示,也更容易学习空间结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/28999.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试官:为什么RPC框架历经数十年还在造轮子?同时期的EJB骨灰都快找不到了!

文章目录 再谈谈RPC的理解RPC的发展史RPC历经数十年而不衰的原因?1、分布式系统的需求2、RPC相关技术的演进3、多语言的支持 本文源自一次面试官的提问:说说你对于RPC框架的了解,你知道哪些RPC框架,以及为什么RPC历经几十年还能不断推出新的…

Unity URP 2D光照导入与配置

上面随时间变化的火烧云和晚霞,篝火的呼吸光照,都是URP的功劳。 1.什么是URP? URP 全称为 Universal Render Pipeline(通用渲染管线)。 它的特点是在手游和端游均能在保持性能的同时有良好的效果 也就说在多数情况下,在下面的平台…

百度卫星地图切换个性化地图

1.切换 if (mapType.value 1) {mapInstance.setMapType(BMAP_SATELLITE_MAP);//卫星地图} else if (mapType.value 2) {mapInstance.setMapType(BMAP_NORMAL_MAP);//标准地图mapInstance.setMapStyleV2({ styleJson: darkJson });//个性化样式}2.不带路况的卫星地图 mapIn…

Android手写占位式插件化框架之apk解析原理系统源码分析

前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂,风趣幽默",感觉非常有意思,忍不住分享一下给大家。 👉点击跳转到教程 前言: 上一篇文章 Android手写占位式插件化框架之Activity通信、Service通…

硬件设计 之 M.2接口常用知识

M.2接口 也被称为NGFF(Next Generation Form Factor),是一种用于固态硬盘(SSD)和无线网络适配器等设备的高速接口标准。它是一种小型、高密度、高速度的接口,可用于替代传统的SATA接口和PCI Express Mini卡…

浪涌保护器行业应用防雷选型方案

当今社会中,电气设备的使用范围越来越广泛,也越来越普及,而与之相关的浪涌保护器就显得尤为重要。在这个领域,有一种高品质的浪涌保护器 —— 地凯防雷SPD浪涌保护器,它可以为各种设备提供强大的保护,并在各…

抖音小程序开发常见问题

抖音小程序 问题1 抖音小程序调试预留白屏 解决 ,连接wifi出现无法打开,用手机流量可以正常访问 抖音小程序 web-view 上传后白屏 抖音小程序使用 webview 白屏,使用web-vew打开h5页面白屏 解决:配置web-view域名 服务器域名配…

【美团面试】软件测试面试题

一、设计登录界面测试用例 功能测试(Function test) 0. 什么都不输入,点击提交按钮,看提示信息。(非空检查) 1.输入正确的用户名和密码,点击提交按钮,验证是否能正确登录。(正常输入&#xff0…

银行金融风险管理面试问题汇总(附答案)

最近有些学员在咨询换工作的事,包括一些金融上市公司的高管。我收集了一些金融风险管理面试问题相关资料,希望能帮助大家。记得收藏此文章,以防之后找不到文章。 风险经理识别和分析潜在的公司风险,并找到减少或避免风险的方法。…

SCT52A40,对标UCC27200、UCC27201半桥驱动IGBT/MOSFET栅极驱动器

特点: • 8-24V宽供电电压 • 驱动高侧和低侧N通道MOSFET • 4A峰值输出源电流和汇电流 • 升压电源电压范围可达120V • 集成阴极负载二极管 • TTL兼容输入,-10V输入 • 45ns传输延迟 • 1000pF负载下7ns上升和4.5ns下降时间 • 2ns延迟匹配时间 • 静…

简单工厂模式详解

文章目录 前言一、简单工厂模式定义二、举个例子三、简单工厂模式的缺点总结 前言 本篇我们了解一下简单工厂模式,它是设计模式的雏形,是学习设计模式的开端,我会结合案例说明它的设计思路。 一、简单工厂模式定义 简单工厂模式并不是GoF23…

督查督办系统通过哪些功能点提高效率

督查督办管理系统,主要实现对督办工作的分解、下派、办理及执行过程的监管,防止督办任务责任不明确、工作积压、工作耽误等问题,提高企业单位或政府部门的执行效率。那督查督办系统主要是通过哪些功能点来提升效率的呢?下面我们用…