GLM: General Language Model Pretrainingwith Autoregressive Blank Infilling翻译理解-编程知识

GLM: General Language Model Pretrainingwith Autoregressive Blank Infilling翻译理解

news/2024/12/21 17:19:25/文章来源:https://blog.csdn.net/chenmingwei000/article/details/131527725

GPT（autoregressive）模型是一个自回归模型，利用left-to-right语言模型，由于不是双向attention 机制，因此不能再NLU任务中，获取充分的上下文信息，BERT类似自编码（autoencoding），通过MLm任务学习，但是不能直接应用到text generation；encoder-deconder模型采用再encoder部分双向attention，在decoder部分单向attention，在摘要提取回应生成 DeBERTa

本模型提出的是自回归空白填充（autoregressive），从题目上看，没什么创新，具体的，随机掩盖连续得tokens与自编码思想相同，顺序得重构对应得掩盖连续spans，遵循自回归预训练，如果单独，从这几句话来讲，说实话和 DeBERTa完全一样，唯一不同的是Deberat是在encoder-decoder decoder部分生成目标，但是GLM是在原始位置处生成，如图1

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/15091.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【SpringBoot——Error记录】

【SpringBoot——Error记录】

java: 警告: 源发行版 17 需要目标发行版 17 问题描述 IDEA运行Spring工程报错：java: 警告: 源发行版 17 需要目标发行版 17 问题原因 idea工具jdk版本使用问题解决办法 1、File(文件) -> Project Structure(项目结构)->修改jdk版本即可选中项目文件…

阅读更多...

spring之ApplicationContext

spring之ApplicationContext

spring之ApplicationContext ApplicationContextApplicationContext源码ApplicationContext继承接口分析ApplicationContext两个比较重要的实现类AnnotationConfigApplicationContextClassPathXmlApplicationContext 国际化---MessageSource资源加载---ResourceLoader获取运行时…

阅读更多...

基于单片机智能加湿器水位防干烧加湿器的设计与实现

基于单片机智能加湿器水位防干烧加湿器的设计与实现

功能介绍以51/STM32单片机作为主控系统；LCD1602液晶显示当前温湿度，当前模式，湿度下限;按键设置湿度下限，当湿度低于下限时开启加湿器;水位传感器检查加湿器是否有水，如果没有水到话加湿器不进行工作，蜂鸣…

阅读更多...

Js提升：如何实现图片懒加载

Js提升：如何实现图片懒加载

知其然，更要知其所有然，在不同场景下该用什么方法，如何做到最优。为什么要出现图片懒加载，解决了什么问题？除了懒加载，还有预加载呢？什么是预加载，怎么实现，相比于懒加载…

阅读更多...

Windows server 下关闭135/139/445端口

Windows server 下关闭135/139/445端口

一、关闭 135端口方案一第一步运行dcomcnfg，打开“组件服务”→“计算机”，在“我的电脑”上右键点击，选“属性”；然后点默认属性，把“在此计算机上启用分布式COM（E）”的勾去掉&a…

阅读更多...

Spring Boot 中的 Zookeeper 分布式锁

Spring Boot 中的 Zookeeper 分布式锁

Spring Boot 中的 Zookeeper 分布式锁分布式锁是分布式系统中常用的一个同步工具，它可以在多个进程之间协调访问共享资源，避免数据不一致或重复处理。在分布式环境中，由于网络通信的延迟和节点故障等原因，传统的锁机制无法满足需…

阅读更多...

软考：中级软件设计师:系统总线，系统可靠性，串联和并联可靠度

软考：中级软件设计师:系统总线，系统可靠性，串联和并联可靠度

软考：中级软件设计师:系统总线， 提示：系列被面试官问的问题，我自己当时不会，所以下来自己复盘一下，认真学习和总结，以应对未来更多的可能性关于互联网大厂的笔试面试，都是需要细心…

阅读更多...

【STM32】步进电机及其驱动（ULN2003驱动28BYJ-48丨按键控制电机旋转）

【STM32】步进电机及其驱动（ULN2003驱动28BYJ-48丨按键控制电机旋转）

本篇文章包含的内容一、步进电机的结构和工作原理1.1 步进控制系统的组成1.2 步进电机简介1.3 步进电机的分类1.4 步进电机的工作原理1.4.1 单极性步进电机（5线4相）1.4.2 双极性步进电机（4线2相）1.4.3 细分器驱动原理 1.5 步进电…

阅读更多...

VMware16.0安装教程和创建

VMware16.0安装教程和创建

许可证： ZF3R0-FHED2-M80TY-8QYGC-NPKYFYF390-0HF8P-M81RQ-2DXQE-M2UT6ZF71R-DMX85-08DQY-8YMNC-PPHV8设置网络添加镜像下载centos7镜像网址https://mirrors.aliyun.com/centos/7/isos/x86_64/?spma2c6h.25603864.0.0.d7724511YPrZpg win10镜像地址https://ww…

阅读更多...

Ceph：关于 Ceph 中 BlueStore 架构以及 OSD 创建的一些笔记

Ceph：关于 Ceph 中 BlueStore 架构以及 OSD 创建的一些笔记

写在前面准备考试，整理ceph 相关笔记内容涉及：Blue Store OSD 存储引擎介绍，对应 OSD 的不同创建方式理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意&…

阅读更多...

【hadoop】大数据的几个基本概念

【hadoop】大数据的几个基本概念

大数据的几个基本概念数据仓库的基本概念数据仓库与大数据OLTP与OLAP 数据仓库的基本概念数据仓库，英文名称为Data Warehouse，可简写为DW或DWH。数据仓库，是为企业所有级别的决策制定过程，提供所有类型数据支持的战略集合。本…

阅读更多...

chatgpt实现NLP基本任务（实体识别、关系抽取、属性抽取、事件抽取、文本分类）

chatgpt实现NLP基本任务（实体识别、关系抽取、属性抽取、事件抽取、文本分类）

文章目录前置：基础函数一、实体识别二、关系抽取三、属性抽取四、事件抽取五、文本分类六、可能存在的问题（报错） 前置：基础函数 import openai import time from tqdm import tqdmdef chatgpt_function(content, keyNone):open…

阅读更多...

推荐文章

最新文章