P40 Transformer

概述

在这里插入图片描述
语法剖析
在这里插入图片描述
在这里插入图片描述
一个样本有多个类别归属
机器自己决定输出几个东西,输出的长度为多少
在这里插入图片描述

seq2seq实现过程

=
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
add+norm 代表 residual + noorm
resudial: input+output ???

Decoder

AT

在这里插入图片描述
在这里插入图片描述
语音或者语句起始的地方,会有一个 special token
在这里插入图片描述
拿机当作输入,输出 器, 输入器 输出 学
在这里插入图片描述
decoder 会把自己的输出当作下一个节点的输入
问题: 会不会造成一步错,步步错
在这里插入图片描述

在这里插入图片描述
decoder 中间遮起来后,跟encoder 类似 差别:masked softmax

masked:
在这里插入图片描述
self -attention : 每个输出 考虑完整的input之后输出
mask - self -attention : 不考虑右边的输入。 如 b2 ,不考虑 a3 a4
在这里插入图片描述
b2 只考虑 a1 a2

  • DECODER 是 masked self-attention , 输出是一个一个输出的,所以只能考虑左边的东西

关键的问题: decoder 必须自己决定输出的 sequence 的长度
希望机器可以自己学到输出的长度。

怎么让 decoder 停止输出呢? --> 增加一个 end 符号
在这里插入图片描述
在这里插入图片描述

NAT

  • AT: 输入 begin , 输出end , 一次输出一个输出

  • NAT: 一次产生一排token, 一个步骤生成一个句子的生成。 问题: 如何确认输出的长度的?
    * 增加两一个 prediction 预测长度
    * 输出一个长序列, end 之后的忽略
    优势:平行化 能控制输出的长度???
    但是,效果没有AT好
    在这里插入图片描述

encoder - decoder 如何连接起来的

在这里插入图片描述在这里插入图片描述

training

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/285708.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

龙迅LT6211B,HDMI1.4转LVDS,应用于AR/VR市场

产品描述 LT6211B 是一款用于 VR/ 显示应用的高性能 HDMI1.4 至 LVDS 芯片。 对于 LVDS 输出,LT6211B 可配置为单端口、双端口或四端口。对于2D视频流,同一视频流可以映射到两个单独的面板,对于3D视频格式,左侧数据可以发送到一个…

nethuner无法ping无法apt

ping无法使用,会提示Socket: Permission denied,在解析的过程中会提示Temporary failure in name resolution. usermod -G 3003 root usermod -G 3003 kali接着 vim /etc/passwd下滑 找到 _apt 然后将_apt 的3004修改为3003 点击esc 输入 :wq 退出编辑模…

定制 Electron 窗口标题栏

Electron 是一款流行的桌面应用开发框架,基于 Web 技术构建,提供了强大的跨平台能力。在开发过程中,经常需要定制窗口标题栏以创造独特的用户体验。 1. 完全隐藏默认标题栏 有时候,我们希望创建一个自定义的标题栏,完…

系统详细设计说明书案例(直接套用)

系统详细设计说明书案例(直接套用) 1.系统总体设计 2.性能设计 3.系统功能模块详细设计 4.数据库设计 5.接口设计 6.系统出错处理设计 7.系统处理规定 软件开发全文档下载:软件开发全套资料-CSDN博客

变量覆盖-doumi靶场搭建

变量覆盖-doumi 一、靶场搭建 1.下载doumi压缩包 2.解压后放入小皮面板 3.将版本改为5.3.29 4.登录网站 返现数据库连接失败 5.输入/install 发现没有权限访问 6.打开根目录 去掉后为 7.再次访问 已经进去了 8.勾选已经阅读,然后点击下一步 9.下一步 10.输入数…

Docker单点部署[8.11.3] Elasticsearch + Kibana + ik分词器

文章目录 一、Elasticsearch二、Kibana三、访问四、其他五、ik分词器第一种:在线安装第二种:离线安装 Elasticsearch 和 Kibana 版本一般需要保持一致才能一起使用,但是从 8.x.x开始,安全验证不断加强,甚至8.x.x之间…

智能优化算法应用:基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于世界杯算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.世界杯算法4.实验参数设定5.算法结果6.参考文…

element组件库的日期选择器如何限制?

本次项目中涉及到根据日期查找出来的数据进行调整,所以修改的数据必须是查找范围内的数据.需要对调整数据的日期进行限制,效果如下: 首先我们使用了element 组件库的日期选择器,其中灌完介绍, picker-options中函数disabledDate可以设置禁用状态,代码如下: <el-date-pickerv…

SD-WAN网络的可扩展性解析

SD-WAN组网以其卓越的可扩展性而脱颖而出&#xff0c;为企业提供了一个灵活适应不断扩张和增长需求的网络解决方案。SD-WAN组网通过轻松实现规模调整、拓扑变更以及多种接入方式的切换&#xff0c;确保网络的高效性和可管理性。对于正处于快速发展时期的企业而言&#xff0c;SD…

【二分查找】【z型搜索】LeetCode240:搜索二维矩阵

LeetCoe240搜索矩阵 作者推荐 【贪心算法】【中位贪心】.执行操作使频率分数最大 本文涉及的基础知识点 二分查找算法合集 题目 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性&#xff1a; 每行的元素从左到右升序排列。 每列的…

OpenAI 偷偷在训练 GPT-4.5!?

最近看到有人已经套路出 ChatGPT 当前的版本&#xff0c;回答居然是 gpt-4.5-turbo&#xff1a; 实际试验下&#xff0c;用 starflow.tech&#xff0c;切换到小星 4 全能版&#xff08;同等官网最新 GPT-4&#xff09;&#xff0c;复制下面这段话问它&#xff1a; What is the…