论文阅读 BERT GPT - transformer在NLP领域的延伸

文章目录

  • 不会写的很详细,只是为了帮助我理解在CV领域transformer的拓展
  • 1 摘要
    • 1.1 BERT - 核心
    • 1.2 GPT - 核心
  • 2 模型架构
    • 2.1 概览
  • 3 区别
    • 3.1 finetune和prompt
  • 3.2 transformer及训练
  • 总结

不会写的很详细,只是为了帮助我理解在CV领域transformer的拓展

1 摘要

1.1 BERT - 核心

双向 编码器 加上mask做完形填空超大模型无监督预训练 需要整个模型作为pretrain weight到下游任务做fintune

1.2 GPT - 核心

自回归 解码器 无需训练 只需Prompt

2 模型架构

2.1 概览

在这里插入图片描述
在这里插入图片描述

3 区别

3.1 finetune和prompt

BERT需要全部参数进行训练
GPT不需要训练即可完成下游任务
在这里插入图片描述

3.2 transformer及训练

BERT使用双向的编码器
在这里插入图片描述

GPT使用自回归的解码器
在这里插入图片描述

总结

总结个毛

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/337255.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

寒武纪显卡实现softmax算子

寒武纪显卡实现softmax基本逻辑 寒武纪实现softmax包括下面5个步骤,我们也采取5个kernel来实现softmax: unionMaxKernel(float* middle, float* source1, int num),这个kernel使用的任务类型是union1,其中middle的长度为taskDim&…

【mysql】—— 用户管理

目录 (一)为什么要有用户管理? (二)用户 2.1 查看用户信息 2.2 创建用户 2.3 删除用户 2.4 修改用户密码 (三)数据库的权限 3.1 给用户授权 3.2 回收权限 (一)为…

查看服务器的yum 源

1、cd /etc/yum.repos.d 2、编辑 CentOS-Stream-Sources.repo 3、 查看里面的yum源地址 4、更新yum源,执行下面指令 yum clean all # 清除系统所有的yum缓存 yum makeacache # 生成新的yum缓存 yum repolist

wind万得P0级故障回顾

万得信息技术股份有限公司(简称wind)是中国大陆领先的金融数据、信息和软件服务企业,总部位于上海陆家嘴金融中心。在国内市场,Wind的客户包括超过90%的中国证券公司、基金管理公司、保险公司、银行和投资公司等金融企业&#xff…

JAVA毕业设计118—基于Java+Springboot的宠物寄养管理系统(源代码+数据库)

毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringboot的宠物寄养管理系统(源代码数据库)118 一、系统介绍 本系统分为管理员、用户两种角色 1、用户: 登陆、注册、密码修改、宠物寄养、寄养订单、宠物…

公司内部核心文件数据\资料防泄密软件系统,防止未经授权文件、文档、图纸、源代码、音视频...等数据资料外泄,自动智能透明加密保护!

为了保护公司内部的核心文件和数据资料,防止未经授权的外泄,使用自动智能透明加密保护软件系统是非常重要的。 这样的系统可以通过以下方式实现防泄密: 自动智能加密:该系统可以对公司内部的核心文件和数据资料进行自动智能加密&…

二线厂商-线上测评-大数据开发

曾经投递过一些中级岗位,在面试之前,会通过邮件的方式把性格测试的题目发给你让你做一下。 一般分为单选题,多选题,性格测试题,认知理解题等等。 大概做了一个小时吧。 单选题: 感觉就是类似于以前高中时候…

大型语言模型与知识图谱的完美结合:从LLMs到RAG,探索知识图谱构建的全新篇章

最近,使用大型语言模型(LLMs)和知识图谱(KG)开发 RAG(Retrieval Augmented Generation)流程引起了很大的关注。在这篇文章中,我将使用 LlamaIndex 和 NebulaGraph 来构建一个关于费城费利斯队(Philadelphia Phillies)的 RAG 流程。 我们用的是开源的 NebulaGraph 来…

工业智能网关如何保障数据通信安全

工业智能网关是组成工业物联网的重要设备,不仅可以起到数据交换、通信、边缘计算的功能,还可以发挥数据安全保障功能,保障工业物联网稳定、可持续。本篇就为大家简单介绍一下工业智能网关增强和确保数据通信安全的几种措施: 1、软…

真心建议,幼师姐妹刷到一定要存下啊

幼师姐妹还不知道?但凡早点发现这个好东西,我也不至于天天加班写各种报告了啊,真的写什么都行,什么总结,教案,评语,日报等等 都能写啊!!!

入驻抖店的费用是多少?最新具体费用详情!

我是电商珠珠 抖店的入驻费用是新手比较关心的问题,网上的说法不一,有说开店要几w的,还有的说不要钱的,什么说法都有。 搞得想要开店的人,心有点慌,害怕超出自己的预算。 接下来我就跟大家详细讲一下&am…

setup 语法糖

只有vue3.2以上版本可以使用 优点: 更少的样板内容,更简洁的代码 能够使用纯 Typescript 声明props 和抛出事件 更好的运行时性能 更好的IDE类型推断性能 在sciprt标识上加上setup 顶层绑定都可以使用 不需要return ,可以直接使用 使用组件…