一张图系列 - “position_embedding”

关于位置编码,我感觉应该我需要知道点啥?

  1. 0、需要知道什么知识?

  2. multi head atten 计算

  3. 复数的常识

  4. 1、embedding 是什么?

  5. position embedding常识、概念,没有会怎样?

  6. 交换token位置,没有PE的话,atten怎么变化?

  7. 2、PE如何实现?需要什么特性?

  8. sin, cos 频率、周期、波长、如何转换?

  9. 为什么这么设计?是如何演进的?

  10. 三角位置编码有哪些重要特性?代码如何实现?

  11. 3、绝对位置编码&相对位置编码的 定义与分类

  12. 绝对位置编码

  13. 相对位置编码

  14. ROPE原理推导、外推长度?

  15. 4、ROPE的具体实现代码

  16. 实现方式1

  17. 实现方式2

什么是position_encoding:

Positional encoding 是在 transformer 模型中用于表示单词位置信息的一种技术。它的主要作用有:

  1. 在 transformer 模型中,由于attention机制是并行计算的,输入的词向量不包含顺序信息,需要positional encoding来表示单词位置。

  2. 让模型学习单词之间的相对位置关系,从而明确上下文语义。

  3. 允许模型学习词序信息,判断词语顺序是否重要。比如"little boy"和"boy little"在语义上是不同的。

  4. 通过在词向量中加入位置信息,可以帮助注意力机制学习句子中单词的相关程度。位置邻近的单词更可能有关联。

  5. Positional encoding一般通过在词向量中加入正弦曲线来实现。通过不同频率的正弦曲线来表示词语的相对位置。

  6. Positional encoding使得模型对词序变化更加鲁棒,能处理词序调整后的句子。

总之,Positional encoding为transformer模型提供了顺序信息,是实现transformer表征能力的重要组成部分。它让模型明确单词顺序和上下文关系,从而更好地理解语义。

参考链接:

1、十分钟读懂旋转编码(RoPE)

2、RoPE引起的长度外推思考

3、六种位置编码的代码实现及性能实验

4、图解Transformer系列一:Positional Encoding(位置编码)

5、Transformer中的位置编码(Position Encoding)

6、【OpenLLM 009】大模型基础组件之位置编码-万字长文全面解读LLM中的位置编码与长度外推性(上)

7、开源LLM大模型位置编码探索

文章首发在“小晨的AI工作室”
因为无法上传高清大图,请公众号回复“rope”进行下载原图。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/179384.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

根据视频编码时间批量重命名视频文件

整理收藏的小视频的时候发现很多视频命名很随意,自己命名又太麻烦,看着乱糟糟的文件又心烦,所有写了这个程序,代码如下: import osfrom filetype import filetype from pymediainfo import MediaInfovideo_extension …

不敢信,30+岁的项目经理会是这样

大家好,我是老原。 你们知道,每个阶段的项目经理都是什么样的吗? 20多岁时,刚踏入项目管理的你可能是个什么都不懂的职场小白,或者只能在旁边打打下手; 到了30岁,经历了项目的人情冷暖&#…

@Version乐观锁配置mybatis-plus使用(version)

1:首先在实体类的属性注解上使用Version import com.baomidou.mybatisplus.annotation.IdType; import com.baomidou.mybatisplus.annotation.TableId; import com.baomidou.mybatisplus.annotation.TableName; import com.baomidou.mybatisplus.annotation.Versio…

OpenCV必知必会基础3(包括色彩空间的变换、ROI、OpenCV中最重要的结构体Mat以及获取图像的属性)

文章目录 OpenCV的色彩空间——RGB与BGROpenCV的色彩空间——HSV与HSLHSV主要用于OpenCV中HSL OpenCV色彩空间转换YUV主要用于视频中题目 图像操作的基石Numpy【基础操作】np.arraynp.zerosnp.onesnp.fullnp.identitynp.eye Numpy基本操作之矩阵的检索与赋值Numpy基本操作三——…

051-第三代软件开发-日志容量时间限制

第三代软件开发-日志容量时间限制 文章目录 第三代软件开发-日志容量时间限制项目介绍日志容量时间限制 关键字: Qt、 Qml、 Time、 容量、 大小 项目介绍 欢迎来到我们的 QML & C 项目!这个项目结合了 QML(Qt Meta-Object Language…

Python Web APP在宝塔发布

本地测试运行:uvicorn main:app --host 127.0.0.1 --port 8082 --reload 宝塔发布: 运行配置——>启动模式:worker_class uvicorn.workers.UvicornWorker

德迅云安全为您介绍关于抗D盾的一些事

抗D盾概述: 抗D盾是新一代的智能分布式云接入系统,接入节点采用多机房集群部署模式,隐藏真实服务器IP,类似于网站CDN的节点接入,但是“抗D盾”是比CDN应用范围更广的接入方式,适合任何TCP 端类应用包括&am…

web缓存-----squid代理服务

squid相关知识 1 squid的概念 Squid服务器缓存频繁要求网页、媒体文件和其它加速回答时间并减少带宽堵塞的内容。 Squid代理服务器(Squid proxy server)一般和原始文件一起安装在单独服务器而不是网络服务器上。Squid通过追踪网络中的对象运用起作用。…

pg_bouncer在使用中的坑勿踩

目录 简介 环境信息 问题配置 问题配置 启动pgbouncer 链接逻辑图 测试存在问题 pgadmin4 Idea JAVA调用 ​编辑 dbeaver 建议: 简介 前面文章说过关于pg_bouncer的安装讲解,这里讲一下在使用中的坑,在进行配置的时候需要注意。 …

6、使用本地模拟器调试项目

本地模拟器推荐内存为16G以上,最低内存要求8G(比较卡顿) 一、安装本地镜像 1、在开发工具的“文件”菜单中选择“设置” 2、在“设置”中选择“SDK”,在右侧勾选“System-image-phone”,点击“应用”开始安装 3、点击…

载誉前行 | 求臻医学MRD检测方案荣获金如意奖·卓越奖

2023年11月11日 由健康界、海南博鳌医学创新研究院 中国医药教育协会数字医疗专业委员会联合主办的 第三届“金如意奖”数字医疗优选解决方案 评选颁奖典礼 在2023中国医院管理年会上揭晓榜单并颁奖 求臻医学MRD检测解决方案 荣获第三届金如意奖最高奖项——卓越奖 这一…

没有第一、第二学历之分!成人学历一样可以填补学历空缺

如果你还在纠结成人学历是不是第一学历的问题, 可以来看看官方怎么说。 (图片来源:教育部官网) 请问专升本(非成人高招专升本)毕业后的第一学历是专科还是本科? 学历是指人们在教育机构中接…