P40 Transformer-编程知识

P40 Transformer

news/2024/11/16 9:51:47/文章来源:https://blog.csdn.net/weixin_39107270/article/details/135068990

概述

在这里插入图片描述
语法剖析

一个样本有多个类别归属
机器自己决定输出几个东西，输出的长度为多少

seq2seq实现过程

在这里插入图片描述

add+norm 代表 residual + noorm
resudial: input+output ？？？

Decoder

AT

在这里插入图片描述

语音或者语句起始的地方，会有一个 special token

拿机当作输入，输出器，输入器输出学

decoder 会把自己的输出当作下一个节点的输入
问题：会不会造成一步错，步步错

在这里插入图片描述
decoder 中间遮起来后，跟encoder 类似差别：masked softmax

masked:
在这里插入图片描述
self -attention : 每个输出考虑完整的input之后输出
mask - self -attention : 不考虑右边的输入。如 b2 ，不考虑 a3 a4

b2 只考虑 a1 a2

DECODER 是 masked self-attention , 输出是一个一个输出的，所以只能考虑左边的东西

关键的问题： decoder 必须自己决定输出的 sequence 的长度
希望机器可以自己学到输出的长度。

怎么让 decoder 停止输出呢？ --> 增加一个 end 符号
在这里插入图片描述

NAT

AT: 输入 begin ，输出end , 一次输出一个输出
NAT: 一次产生一排token, 一个步骤生成一个句子的生成。问题：如何确认输出的长度的？
* 增加两一个 prediction 预测长度
* 输出一个长序列， end 之后的忽略
优势：平行化能控制输出的长度？？？
但是，效果没有AT好

encoder - decoder 如何连接起来的

在这里插入图片描述

training

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/285708.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

龙迅LT6211B，HDMI1.4转LVDS，应用于AR/VR市场

龙迅LT6211B，HDMI1.4转LVDS，应用于AR/VR市场

产品描述 LT6211B 是一款用于 VR/ 显示应用的高性能 HDMI1.4 至 LVDS 芯片。对于 LVDS 输出，LT6211B 可配置为单端口、双端口或四端口。对于2D视频流，同一视频流可以映射到两个单独的面板，对于3D视频格式，左侧数据可以发送到一个…

阅读更多...

nethuner无法ping无法apt

nethuner无法ping无法apt

ping无法使用，会提示Socket: Permission denied，在解析的过程中会提示Temporary failure in name resolution. usermod -G 3003 root usermod -G 3003 kali接着 vim /etc/passwd下滑找到 _apt 然后将_apt 的3004修改为3003 点击esc 输入 :wq 退出编辑模…

阅读更多...

定制 Electron 窗口标题栏

定制 Electron 窗口标题栏

Electron 是一款流行的桌面应用开发框架，基于 Web 技术构建，提供了强大的跨平台能力。在开发过程中，经常需要定制窗口标题栏以创造独特的用户体验。 1. 完全隐藏默认标题栏有时候，我们希望创建一个自定义的标题栏，完…

阅读更多...

系统详细设计说明书案例（直接套用）

系统详细设计说明书案例（直接套用）

系统详细设计说明书案例（直接套用） 1.系统总体设计 2.性能设计 3.系统功能模块详细设计 4.数据库设计 5.接口设计 6.系统出错处理设计 7.系统处理规定软件开发全文档下载：软件开发全套资料-CSDN博客

阅读更多...

变量覆盖-doumi靶场搭建

变量覆盖-doumi靶场搭建

变量覆盖-doumi 一、靶场搭建 1.下载doumi压缩包 2.解压后放入小皮面板 3.将版本改为5.3.29 4.登录网站返现数据库连接失败 5.输入/install 发现没有权限访问 6.打开根目录去掉后为 7.再次访问已经进去了 8.勾选已经阅读，然后点击下一步 9.下一步 10.输入数…

阅读更多...

Docker单点部署[8.11.3] Elasticsearch + Kibana + ik分词器

Docker单点部署[8.11.3] Elasticsearch + Kibana + ik分词器

文章目录一、Elasticsearch二、Kibana三、访问四、其他五、ik分词器第一种：在线安装第二种：离线安装 Elasticsearch 和 Kibana 版本一般需要保持一致才能一起使用，但是从 8.x.x开始，安全验证不断加强，甚至8.x.x之间…

阅读更多...

智能优化算法应用：基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码文章目录智能优化算法应用：基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.世界杯算法4.实验参数设定5.算法结果6.参考文…

阅读更多...

element组件库的日期选择器如何限制?

element组件库的日期选择器如何限制?

本次项目中涉及到根据日期查找出来的数据进行调整,所以修改的数据必须是查找范围内的数据.需要对调整数据的日期进行限制,效果如下: 首先我们使用了element 组件库的日期选择器,其中灌完介绍, picker-options中函数disabledDate可以设置禁用状态,代码如下: <el-date-pickerv…

阅读更多...

SD-WAN网络的可扩展性解析

SD-WAN网络的可扩展性解析

SD-WAN组网以其卓越的可扩展性而脱颖而出，为企业提供了一个灵活适应不断扩张和增长需求的网络解决方案。SD-WAN组网通过轻松实现规模调整、拓扑变更以及多种接入方式的切换，确保网络的高效性和可管理性。对于正处于快速发展时期的企业而言，SD…

阅读更多...

【二分查找】【z型搜索】LeetCode240:搜索二维矩阵

【二分查找】【z型搜索】LeetCode240:搜索二维矩阵

LeetCoe240搜索矩阵作者推荐【贪心算法】【中位贪心】.执行操作使频率分数最大本文涉及的基础知识点二分查找算法合集题目编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性： 每行的元素从左到右升序排列。每列的…

阅读更多...

打卡打卡打卡

打卡打卡打卡

12.19

阅读更多...

OpenAI 偷偷在训练 GPT-4.5！？

OpenAI 偷偷在训练 GPT-4.5！？

最近看到有人已经套路出 ChatGPT 当前的版本，回答居然是 gpt-4.5-turbo： 实际试验下，用 starflow.tech，切换到小星 4 全能版（同等官网最新 GPT-4），复制下面这段话问它： What is the…

阅读更多...

推荐文章

最新文章