国科大-自然语言处理复习

自然语言处理复习

  • 实体关系联合抽取
    • 流水线式
    • 端到端方法
  • 检索式问答系统
    • 流水线方式
      • 信息检索(IR)阶段
      • 阅读理解(RC)阶段
      • 基于证据强度的重排
      • 基于证据覆盖的重排
      • 结合不同类型的聚合
    • 端到端方式
      • Retriever-Reader的联合学习
      • 基于预训练的Retriever-Free方法
  • 情感分析
    • 联合三元组抽取

谨以此博客作为复习期间的记录

实体关系联合抽取

流水线式

  • 流水线式抽取(Pipline): 把关系抽取的任务分为两个步骤,首先进行实体识别,再抽取出两个实体的关系。
    在这里插入图片描述

  • 联合抽取(Joint Extraction): 端到端,同时进行实体和关系的抽取。流水线式抽取会导致误差在各流程中传递和累加,而联合抽取的方式则实现难度更大

端到端方法

在这里插入图片描述
流水线式抽取和新标注策略的实体关系联合抽取都可以和序列标注结合起来,
在这里插入图片描述

在这里插入图片描述

检索式问答系统

流水线方式

Document Retriever 和 Document Reader 分两步

  • Document Retriever:通过TF-IDF检索维基百科中与问题相关的Top K个文档
  • Document Reader:将答案抽取转化为抽取式阅读理解问题
  • • 输入:一个文档段落,一个自然语言描述的问题
  • • 输出:段落中抽取的答案片段
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

论文中提出的模型结构主要包括两个阶段:信息检索(IR)和阅读理解(RC),以及两种答案重排方法:基于证据强度的重排和基于证据覆盖的重排。以下是这些模型组件的详细介绍:

信息检索(IR)阶段

  • 目标:检索与给定问题最相关的网页段落。
  • 方法:使用搜索引擎(例如谷歌或必应)来找到与问题最相关的顶级网页段落。
  • 特点:与标准阅读理解任务不同,在开放领域设置中,RC模型通常在远程监督下进行训练。这意味着在训练阶段,RC模型会将包含正确答案的所有段落与问题进行匹配

阅读理解(RC)阶段

  • 目标:从检索到的段落中提取答案。
  • 方法:使用阅读理解模型(例如R3模型)来从这些段落中提取候选答案。
  • 特点:与单个固定段落的标准阅读理解任务不同,开放领域问答需要处理多个段落,并从中提取候选答案

基于证据强度的重排

  • 目的:利用段落中出现答案的频率或概率来评估答案的强度。
  • 实现:计算每个答案在顶级答案候选中出现的次数,或者将RC模型为每个答案跨度分配的概率相加,以确定最终预测

基于证据覆盖的重排

  • 目的:根据不同段落的证据如何覆盖问题来排列答案候选。
  • 实现:首先将包含答案的段落连接成一个“伪段落”,然后使用匹配LSTM模型来衡量这个伪段落如何涵盖问题的各个方面

结合不同类型的聚合

  • 方法:将两种重排方法的输出进行加权组合,无需额外训练。
  • 特点:首先使用softmax重新归一化两种基于强度的重排器和一个基于覆盖的重排器提供的前5个答案得分,然后对相同答案的得分进行加权求和,选择得分最高的答案作为最终预测

这种结合信息检索、阅读理解和多种重排策略的方法充分利用了多个段落的证据,有效地提高了开放领域问答系统的性能。

端到端方式

Retriever-Reader的联合学习

Lee et al., Latent Retrieval for Weakly Supervised Open Domain Question Answering, ACL,2019
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

基于预训练的Retriever-Free方法

Petroni et al. Language Models as Knowledge Bases? ACL, 2019

情感分析

联合三元组抽取

将问题转为一个序列生成问题
统一输入输出的标准
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

A Unified Generative Framework for Aspect-Based Sentiment Analysis

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/411786.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

甜蜜而简洁——深入了解Pytest插件pytest-sugar

在日常的软件开发中,测试是确保代码质量的关键步骤之一。然而,对于测试报告的生成和测试结果的可读性,一直以来都是开发者关注的焦点。Pytest插件 pytest-sugar 以其清晰而美观的输出,为我们提供了一种愉悦的测试体验。本文将深入介绍 pytest-sugar 插件的基本用法和实际案…

【MySQL】权限控制

DCL-权限控制 查询权限 show grants for 用户名主机名;授予权限 grant 权限列表 on 数据库名.表名 to 用户名主机名;grant all on test.* to user%; %是通配符,表示任意主机。撤销权限 revoke 权限列表 on 数据库名.表名 from 用户名主机名;revoke all on test.*…

【Unity】【VRTK】【Pico】如何快速在VRTK中引入带动画的PICO控制器

【背景】 之前的VRTK篇章中,我只介绍了Oculus,Open VR,SImulator这三种Rig的配置方法,那么Pico如何融合VRTK进行开发呢? 【需要的开发包】 先像一个正常PICO项目那样导入PICO的SDK到Unity。VRTK 4的Package导入器中搜Pico,可以导入一个Pico的Integration,导入后Projec…

旅游平台day02

1. 用户注册 概述: 常见的注册方式:邮箱注册、手机号注册、昵称注册、或者以上几种同时支持 本项目仅仅支持手机号注册 需求: 项目启动后,访问regist.html进入注册页面 手机号校验 前后台都需要对手机号进行校验 前端校验&am…

SpringMVC(全局异常处理.动态接收Ajax请求)

1.全局异常处理 1 异常处理器 基于AOP 用户发起请求, SpringMVC接受请求, SpringMVC加载静态资源问题说明 请求过去了,但没有处理 规则说明:静态资源进入SpringMVC框架之后,没有找到要怎样处理静态资源的方法,所以他们就不解决,也就不显示 解决方法:SpringMVC基于Servlet处理…

配置redis挂载

1. 暂停和删除redis 2.创建文件夹 /usr/local/software/redis/6379/conf/ /usr/local/software/redis/6379/data/ 把redis-conf文件上传到conf文件夹中 3.配置网络 docker network create --driver bridge --subnet172.18.12.0/16 --gateway172.18.1.1 wn_docker_net 4.运…

快速入门Java NIO(Not I/O)的网络通信框架--Netty

Netty 入门 了解netty前需要对nio有一定认识,该笔记基础来自bilinbili黑马,在此基础上自己学习的笔记,添加了一些自己的理解 了解java 非阻塞io编程 1. 概述 1.1 Netty 是什么? Netty is an asynchronous event-driven network application framework for rapid …

MATLAB - 机翼摇摆过程中飞机的模型参考自适应控制

系列文章目录 前言 本例说明如何控制三角翼飞机在机翼摇晃时的横滚和横滚速率。在本例中,系统模型是未知的。因此,需要使用模型参考自适应控制 (MRAC) 使控制系统与理想参考模型相匹配。飞机在 Simulink 中建模,MRAC 控制器使用 Simulink Co…

被遗忘在角落的RPA,成了提升AI Agent执行能力的天选神器

LLM(Large Language Models)刚爆发之时,很多人认为RPA要完了,自然语言交互API操作足以干掉任何UI自动化工具。 然而,大语言模型应用发展到AI Agent这一步,大家才发现API并不是万能的。Agent平台雨后春笋一…

Unity向量叉乘

叉乘计算公式 Unity中叉乘计算 Vector3.Cross(A.position, B.position); 几何意义 假设向量A和B 都在XZ平面上 向量A叉乘向量B y大于0 证明 B在A右侧 y小于0 证明 B在A左侧 示例 Vector3 C Vector3.Cross(A.position, B.position); if(C.y > 0) {print("B在A右侧&qu…

阿里云国外服务器价格表

阿里云国外服务器优惠活动「全球云服务器精选特惠」,国外服务器租用价格24元一个月起,免备案适合搭建网站,部署独立站等业务场景,阿里云服务器网aliyunfuwuqi.com分享阿里云国外服务器优惠活动: 全球云服务器精选特惠…

图解第五代英特尔至强可扩展处理器

四年五节点,一年出两代。在年初推出代号Sapphire Rapids(蓝宝石激流,SPR)的第四代英特尔至强可扩展处理器之后,仅隔11个月,代号Emerald Rapids(绿宝石激流,EMR)的第五代英…