神经网络模型底层原理与实现8-BERT

首先介绍什么是自监督学习:b46dcc508bad489ab998a93cca78b856.png

普通的有监督学习是每个x对应有个y',x训练得到y,将y与y'作比较,而自监督是没有对应y',直接把一部分样本x作为训练目标x'',训练得x'后和x''对比

 

bert中如何创造x':以文字处理为例,把字随机遮住或者随机替换一些,把新的字符串组输入bert后经过linear和softmax层得到的结果和实际字符(比如这里是湾)做交叉熵,从而训练bert的参数

ab8d90fe44fd40aba1c1ce3d02d2d2e5.png

 在模型学会做填空题之后,经过微调就可以解决其他不同的任务,测试的时候会根据8个任务看总体效果

 

如何使用bert:4个case:

1.语言情感分析(输入一个序列,输出这个序列是积极还是消极的)

0dff5a3dc69b4f389c55c668e3a967c7.png

方法:在输入的字符串前面加cls字符,通过这个字符的输出经过线性层后得到类别,bert的作用是得到一个比较好的初始化参数(注:需要有提前标注的数据)

 

2.词性分析

1fb3341660aa486597fcf8a7807cbd86.png

根据每个词的输出过线性层看词性

 

3.判断两个句子是否矛盾

bafb18351e51448b9d2451a92d2b390c.png

把两个句子中间加个分割符,根据句首的cls符对应的输出判断关系

 

4.根据一个问题,从一段话里截出一部分作为答案

17b71a3b8cf34007ae7dbbbcba56d726.png  

方法:随机初始两个向量(需要训练的两个东西)把他们分别和d1,d2,d3的输出做内积并过softmax层,得到最大值的位置就是截取文本的开始和结束位置 

 

注意:因为attention运算量较大,一般不输入太长的,因此会把文本分成一段一段放进去

为什么bert有效:一个词的意思可以从它的上下文得出,而bert学做填空题的过程就是抽取上下文的资信

bert实验结果的神奇之处:bert可以让不同语言得到的词语向量很接近,每个词的英文和中文的差距几乎是一个固定值

 

 

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/619687.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【备战测开】—— 编程语言Python(二)

续上上篇的讲解:【备战测开】—— 编程语言Python(一) 6 面向对象编程 所谓的面向对象其实就是把属性和方法封装起来,以供重复调用 6.1 类和对象 参考博客:python类和对象最全详解(持续修订中&#xff…

vue3 动态class和style

1、需求:一个删除的弹窗,点击会提示“是否需要删除XXXXX(name)”,但是name不固定,所以删除弹窗的width不能写死。(如果不设置width,本项目的弹窗会自适应变得特别长)

最新版守约者二级域名分发系统

主要功能 二级域名管理: 我们的系统提供全面的二级域名管理服务,让您轻松管理和配置二级域名。 域名分发:利用我们先进的域名分发技术,您可以自动化地分配和管理域名,确保每个用户或客户都能及时获得所需的域名资源。…

[Spring Cloud] (3)gateway令牌token拦截器

文章目录 集成redisNacos配置增加 redis配置配置pomredis配置RedisConfigredis序列化工具FastJson2JsonRedisSerializer测试 令牌校验拦截器nacos配置拦截器代码微服务登录接口实现 最终效果-登录接口与数据接口 本文gateway与微服务已开源到gitee 杉极简/gateway网关阶段学习 …

深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

在生物信息学、合成生物学、药物研发、生物材料制备等领域,深度学习技术的革新正在重塑蛋白质设计工具的边界,使其从单纯的结构预测跃升至具有创造性的设计层面。RFdiffusion作为美国华盛顿大学David Baker教授团队的最新科研成果,凭借其卓越…

springboot+vue科普知识商城考试论坛交流系统网站

本系统主要是设计出新能源科普网站,基于B/S构架,后台数据库采用了Mysql,可以使数据的查询和存储变得更加有效,可以确保新能源科普网站管理的工作能够正常、高效的进行,从而提高工作的效率。总体的研究内容如下&#xf…

软考之零碎片段记录(十五)+复习巩固(十)

一、学习 1. 多对多关系模式 举例:学生和课程。顾客和商品等。 多对多关系的确立需要有中间表,需要使用两个外键确认表中的唯一数据。 2. 数据库范式 1nf 表中每个字段都是原子性不可查分的。在关系(或表)中,每一行…

2024年跨境电商展览会,深圳+广州+厦门+宁波等地火力全开!

雨果网CCEE全球跨境电商展览会(深圳) 深圳会展中心(福田) 2024年5月11日-13日 2024第七届全球跨境电商节暨第九届深圳国际跨境电商贸易博览会 2024年 6月15日—17日 在深圳会展中心(福田) ICBE2024深圳国际跨境电商交易博览会 2024年9月02-04日 …

【leetcode面试经典150题】35.螺旋矩阵(C++)

【leetcode面试经典150题】专栏系列将为准备暑期实习生以及秋招的同学们提高在面试时的经典面试算法题的思路和想法。本专栏将以一题多解和精简算法思路为主,题解使用C语言。(若有使用其他语言的同学也可了解题解思路,本质上语法内容一致&…

云服务器上Docker启动的MySQL会自动删除数据库的问题

一、问题说明 除了常见的情况,例如没有实现数据挂载,导致数据丢失外,还需要考虑数据库是否被攻击,下图 REVOVER_YOUR_DATA 就代表被勒索了,这种情况通常是数据库端口使用了默认端口(3306)且密码…

【Linux网络编程】UDP协议

UDP协议 1.再谈端口号端口号划分认识知名端口号(Well-Know Port Number)两个问题netstatpidof 2.UDP协议2.1UDP的特点2.2面向数据报2.3UDP的缓冲区2.4UDP使用注意事项2.5基于UDP的应用层协议 喜欢的点赞,收藏,关注一下把! 1.再谈端口号 端口…

【力扣】101. 对称二叉树

101. 对称二叉树 题目描述 给你一个二叉树的根节点 root , 检查它是否轴对称。 示例 1: 输入:root [1,2,2,3,4,4,3] 输出:true 示例 2: 输入:root [1,2,2,null,3,null,3] 输出:false 提示…