Planarized sentence representation for nested named entity recognition

原文链接:

https://www.sciencedirect.com/science/article/pii/S0306457323000894?via%3Dihub

Information Processing & Management 2023 

介绍

        问题

         可以通过枚举span的方法来解决嵌套实体,然而目前的模型忽略了span之间的语义依赖关系(23年看见两三篇都是对span之间的关系进行建模的)。

        IDEA 

        作者提出了一种planarized 句子表征来表示嵌套实体,并使用一个双向二维的递归操作来学习span之间的语义依赖关系。

方法

         整个模型的结构如下图所示,大体上可以分为三个部分:encoder、Bi-TDNN和最后的分类。

Encoder 

         表示一句长为N的句子,ti表示第i个token。

        对于每个token,使用bert embedding、distance embedding(学习句子中token的位置信息)、region embedding(表示在矩阵中的上下三角区域的分布特征)、attention embedding (对与输出相关的输入特征进行加权)这四种不同的embedding来表示不同特征,然后将其进行concate,具体表示如下:

Bi-TDNN

         为了得到句子的二维表示,作者设计了两种self-cross。

first self-cross encoding

        将序列H作为输入,其中表示span平均池化后的结果,即表示在句子T中跨度为(i,j)的span 表征:

         为了对其进行语义特征归一化,使用条件归一化层CLN进行处理:

        送入一个MLP进行降维,并输入双向二维递归层(没有很get到这一层的具体操作)来学习跨度之间的语义依赖关系。

second self-cross encoding

         在bert的输出H上使用两个独立的FFNN,得到两个token序列表征,作者认为这两个token是同一token ti的不同表征(与biaffine一样),可以被视为句子的开始和结束边界表征T,即第二种self-cross encoding表示为:

        将这两种self-cross encoding的结果进行残差连接,得到句子T的平面语义表征:

Bidirectional two-dimensional convolution

         中的元素表示span的表征,语义上是独立的,即L的分布可以通过以下公式进行计算:

        根据一阶马尔可夫假设,上式可进行化简等价,即每个标签Lij只取决于其相邻span表征

        作者使用一个包含GRU的双向二维递归神经网络Bi-TDNN来学习语义依赖:

        R-TDNN从左上角到右下角的整个语义平面上进行迭代执行,学习了语义依赖关系,但由于span之间的依赖是双向的,因此还需要从右下角到左上角建立一个基于网格的时延神经网络,以便将语义依赖向另一个方向倾斜:

Training objective 

         将结合得到的F进行分类:

        模型的loss为:

实验

对比实验

         在genia、ace2005和ace2004这三个数据集上进行实验,结果如下图所示:

         在NNE和KBP17数据集上进行实验,结果如下所示:

        作者认为与其他方法相比,作者的模型达到了competitive performance。平面化句子表示具有解决嵌套结构和使用跨度语义特征的优势,并且这种表示方法能够实现二维循环,有效的学习span之间的语义依赖关系。 

        在两个flat数据集上进行实验,结果如下图所示:

消融实验 

        对多个模块进行消融实验,结果如下所示: 

        在每个方向上,二维递归操作假设了两个方向上的语义依赖,从而产生了四种语义依赖模式。该实验旨在证明语义依赖模式在 Bi-TDNN 模块中的影响,实验结果如下所示: 

其他实验

        层数对结果的影响:

        参数量:

总结

        对span之间的语义关系进行建模也算不上太新的idea,而且二维递归网络那里没有很看懂,而且论文的结构我感觉怪怪的,用的符号也怪怪的(是我看太少了?)。实验结果也不是很好,而作者也并没有对实验结果进行具体分析,只是提了一句competitive,感觉不太能说服人。不过做了很多的实验,消融实验那个地方也是,感觉怪怪的。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/318001.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023我的编程之旅-地质人的山和水

引言 大家好,我是搞地质的。外行人有的说我们游山玩水,有的说我们灰头土脸,也有的说我们不是科学。 而我说,这是一门穷极一生青春,值得奉献的行业。这是一门贴近民生,又拥抱自然的学科。他的真理性在于探…

长见识!!!Java中除了消息队列之外,竟然还能这样实现异步任务

今年IT寒冬,大厂都裁员或者准备裁员,作为开猿节流主要目标之一,我们更应该时刻保持竞争力。为了抱团取暖,林老师开通了《知识星球》,并邀请我阿里、快手、腾讯等的朋友加入,分享八股文、项目经验、管理经验…

java进阶四-深入理解泛型和注解

泛型和注解是框架技术必备的技能 5 泛型5.1泛型理解5.1.1 泛型概念5.1.2 泛型的特点5.1.3 如何理解Java中的泛型是伪泛型?5.1.4 泛型的价值 5.2 泛型语法5.2.1 泛型类5.2.2 泛型接口3.2.3 泛型方法3.2.4泛型的上下边界3.2.5创建泛型数组 5.3泛型应用场景5.3.1数据库…

SQL Server注入之攻防技战法

那天下着很大的雨,母亲从城里走回来的时候,浑身就是一个泥人,那一刻我就知道我没有别的选择了 1.Mssql报错注入 0.判断数据库类型 1.爆当前用户名 2.爆版本 3.爆服务器名 4.判断数据库个数 5.获取全部数据库 语句只适合>2005 爆当前数据…

Windows下Jenkins自动化部署SpringBoot应用

Windows下Jenkins自动化部署SpringBoot应用 1、下载安装包 下载地址: 一个是 msi 程序: https://mirrors.aliyun.com/jenkins/windows/ 一个是 war 程序: https://get.jenkins.io/war-stable/ https://mirrors.jenkins.io/war/ 这里我…

机器人动力学一些笔记

动力学方程中,Q和q的关系(Q是sita) Q其实是一个向量,q(Q1,Q2,Q3,Q4,Q5,Q6)(假如6个关节) https://zhuanlan.zhihu.com/p/25789930 举个浅显易懂的例子,你在房…

GO语言笔记1-安装与hello world

SDK开发工具包下载 Go语言官网地址:golang.org,无法访问Golang中文社区:首页 - Go语言中文网 - Golang中文社区下载地址:Go下载 - Go语言中文网 - Golang中文社区 尽量去下载稳定版本,根据使用系统下载压缩包格式的安装…

西北工业大学计算机组成原理实验报告——verilog前两次

说明 为了有较好的可读性,报告仅仅粘贴关键代码。该PDF带有大纲功能,点击大纲中的对应标题,可以快速跳转。 实验目标 掌握单周期CPU执行指令的流程和原理;学习使用verilog HDL语言实现单周期CPU, 并通过功能仿真;提…

【教学类-43-14】 20240103 (4宫格数独:正确版:576套) 不重复的基础模板数量:576套

作品展示::——4宫格 576套不重复模板(48页*12套题) 背景需求: 生成4宫格基础模板768套,观看64页内容时,明显看到有错误 【教学类-43-13】 20240103 (4宫格数独:错误版…

如何做好档案数字化前的鉴定工作

要做好档案数字化前的鉴定工作,可以按照以下步骤进行: 1. 确定鉴定目标:明确要鉴定的档案的内容、数量和性质,确定鉴定的范围和目标。 2. 进行档案清点:对档案进行全面清点和登记,包括数量、种类、状况等信…

洗地机怎么选?哪款洗地机好用?

选择洗地机前,我们需要对自己购买洗地机的需求做一个清洗的判断,吸尘器和扫地机智能解决地面基本的清洁问题,作为新兴的清洁工具洗地机越来越受大家的喜欢,洗地机的品类很多,洗地机到底该买哪款呢?我们先来看看挑选洗…

pod篇:

pod环节: pod是k8s中最小的资源管理组件 pod也是最小化运行容器化的应用的资源对象 pod是一个抽象的概念,可与理解为一个或者多个容器化应用的集合 在一个pod当中运行一个容器是最常用的方式。 再一个pod当中可以同时运行多个容器,在一个…