机器学习:自督导式学习模型

outline

在这里插入图片描述

自督导式模型有跨语言的能力

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 中文:DRCD的数据集
  • 英文:SQuAD的数据集
    在104种语言上进行学习,并在英文上进行微调,结果在中文上效果也比较好。
    在这里插入图片描述
    XTREME Benchmark
    只用英文进行微调,在其他剩下的语言中进行测试。
    在这里插入图片描述
    bert可以无视语言的表象,只了解符合背后代表的语义。
    在这里插入图片描述
    看看英文对中文相近的分数算出来,然后取平均值得到MRR,该值越大越好。
    在这里插入图片描述
    在这里插入图片描述
    语言的信息藏在哪里呢?通过embedding展示,相近的词更接近
    在这里插入图片描述
    在这里插入图片描述
    英文转化成向量后,并对其进行偏移向量后,能够重构为中文。
    在这里插入图片描述
    在这里插入图片描述

可以在英文上测试,并在中文上进行测试。中英文上的embedding是有点差距的。

自督导式模型有跨领域的能力

在这里插入图片描述
在这里插入图片描述
把DNA的组成替换成字符型的表示形式进行学习
在这里插入图片描述
用bert有明显的提升。不仅学到了语义信息,也学到了一些通用的能力,在其他领域也能有较好的性能,
在这里插入图片描述
在DNA 蛋白质 音乐上都有所帮助。
在这里插入图片描述
pre-trained模型有强化模型的能力
在这里插入图片描述
跨语言学习的能力用在语音回答系统。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
终极状态:输入是语音,输出也是语音。
在这里插入图片描述
光用hubert是不行的,可以通过中间层后再加几层网络:

在这里插入图片描述
可以把Hubert的输出 丢给文字的预训练Bert
在这里插入图片描述
在这里插入图片描述

在人造的资料上训练Bert

在这里插入图片描述
在这里插入图片描述
通过规则生成一些tokens,并将tokens进行映射,之后再送到网络中进行学习。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • random产生的资料的效果不好
  • pair产生资料的效果还是非常明显的
  • shuffle产生的资料效果还是可以的
    在这里插入图片描述
    token的序列长度是非常重要的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/289267.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pytorch实现DCP暗通道先验去雾算法及其onnx导出

pytorch实现DCP暗通道先验去雾算法及其onnx导出 简介实现ONNX导出导出测试 简介 最近在做图像去雾,于是在Pytorch上复现了一下dcp算法。暗通道先验去雾算法是大神何恺明2009年发表在CVPR上的一篇论文,还获得了当年的CVPR最佳论文。 实现 具体原理就不…

软件测试项目测试报告总结

测试计划概念:就在软件测试工作实施之前明确测试对象,并且通过资源、时间、风险、测试范围和预算等方面的综合分析和规划,保证有效的实施软件测试。 需求挖掘的6个方面: 1、输入方面 2、处理方面 3、结果输出方面 4、性能需求…

HAOS如何添加小米设备

环境: Home Assistant 11.2 Xiaomi Miot Auto 0.7.14 问题描述: HAOS如何添加小米设备 解决方案: 1.通过 HACS 自动安装 打开 Home Assistant 的 HACS 页面 2.搜索小米 3.在新打开的页面中找到Xiaomi MIoT,下载安装 下载 …

掌握pip的基本命令和高级用法:轻松管理Python包

掌握pip的基本命令和高级用法 一、简介二、安装和配置pip三、基本命令和用法3.1、安装和卸载包3.2、包管理3.3、包依赖管理3.4、虚拟环境管理 四、高级用法4.1、自定义pip的配置4.2、使用requirements.txt文件管理项目依赖4.3、创建和发布自己的Python包4.4、使用pip下载非Pyth…

【✅Java中有了基本类型为什么还需要包装类?】

✅Java中有了基本类型为什么还需要包装类? ✅Java中有了基本类型为什么还需要包装类✅Java的8中基本数据类型 ✅知识拓展✅基本类型和包装类型的区别✅如何理解自动拆装箱?✅拆箱与装箱✅自动拆装箱✅自动拆装箱原理 ✅哪些地方会自动拆装箱?…

条款6:若不想使用编译器自动生成的函数,就该明确拒绝

有些场景我们不需要编译器默认实现的构造函数,拷贝构造函数,赋值函数,这时候我们应该明确的告诉编译器,我们不需要,一个可行的方法是将拷贝构造函数和赋值函数声明为private。 class HomeForSale { ... }; HomeForSal…

linux、widnows的免费局域网桌面远程工具之NoMachine

统信UOS、银河麒麟及其他的linux桌面系统/windows系统都可进行远程桌面操作使用。 1.先到官网下载https://downloads.nomachine.com/自己使用的软件版本。 2.首先下载windwos端的的版本64位进行安装,安装是先暂时退出windows的杀毒软件,以免提示你各种确…

Clonable 接口和深拷贝

Object 类中存在一个 clone 方法, 调用这个方法可以创建一个对象的 “拷贝”. 想用clone方法时报错了,查看一下: clone方法被protected修饰.不同包只能在子类中访问,可以用super关键字访问clone方法返回类型是Object,所以需要向下转型CloneNotSupportedException是受查异常…

FormData文件上传多文件上传

一、简介 ​ 通常情况下,前端在使用post请求提交数据的时候,请求都是采用application/json 或 application/x-www-form-urlencoded编码类型,分别是借助JSON字符串来传递参数或者keyvalue格式字符串(多参数通过&进行连接&#…

React 中的 ref 和 refs:解锁更多可能性(上)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

算法分析与设计课后练习29

给定集合S{3, 7, 5, 9}, C 20, 近似参数 ε0.2, 写出 近似算法求解子集和问题的过程。

ThinkPad E550c

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、pandas是什么?二、使用步骤 1.引入库2.读入数据总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:…