论文阅读:End to End Chinese Lexical Fusion Recognition with Sememe Knowledge

news/2024/11/15 14:40:52/文章来源:https://www.cnblogs.com/zinger/p/18334377

模型

  • 论文中提出的模型旨在联合处理提及词汇共指关系
  • 该模型由一个编码器、一个用于提及识别的CRF解码器和一个用于共指识别的BiAffine解码器组成。
  • 此外,利用HowNet的sememe知识增强了编码器。

基础模型

  • 编码器:利用 BERT 作为基本编码器:

\[h_1 ... h_n = BERT(c_1,...,c_n) \]

  • 提及识别:利用CRF解码器获取序列标记输出。这有助于识别所有提及的词汇,包括融合词和分离词。(\(L_{mention}\)训练目标是最小化 gold-standard tagging sequence 的交叉熵)
  • 共指识别:在确定提及对是否为共指关系时,模型利用了BiAffine解码器。(\(L_{coref}\)采用平均交叉熵损失
  • 联合训练:将两个子任务的损失合并在一起进行联合训练。(\(L_{joint} = L_{mention} + \alpha L_{coref}\)

Sememe加强模型

从HowNet构建Sememe。字符表示的语义通过两个步骤获得:
1)首先,通过其sememe图和其源词的位置偏移得到sememe表示

  • 使用GAT构建sememe图。
  • 第二部分是通过嵌入意义源词的位置偏移直接获得的。 位置偏移量用 [s,e] 表示,其中 s 和 e 表示源词的开始和结束字符与当前字符的相对位置。
  • 接下来,我们将这两个部分连接起来,得到意义表示。

2)然后,通过全局注意力,聚合所有意义表示以达到字符级表示,从而产生 sememe 增强编码器。

补充

BiAffine解码器

BiAffine解码器的核心思想是利用双仿射(BiAffine)关系来对元素对之间的潜在关系进行建模和评分。BiAffine解码器通常接受来自神经网络(如LSTM或Transformer)的上下文化特征表示作为输入。

  • 特征提取:从输入文本中提取特征,通常这一步是通过预训练的模型(如BERT)来完成的。
  • 仿射变换:对提取的特征进行两次不同的仿射变换,生成两组向量。每组向量代表文本中的每个元素(如单词或字符)。
  • BiAffine操作:将两组向量通过双仿射操作结合起来,生成一个关系矩阵。矩阵中的每个元素表示一对元素之间的关系得分。
  • 解码和链接:根据关系矩阵中的得分,进行解码操作,确定元素对之间的关系(如是否共指、依存关系类型等)。
  • 优化:通过训练数据优化模型参数,使得模型能更准确地识别和预测元素之间的真实关系。

GAT:图注意力网络

GAT是一种专门用于处理图结构数据的深度学习模型。它的核心是注意力机制,它允许模型聚焦于重要的节点,并动态地从邻近节点聚合信息:

  • 节点表示:每个节点都有一个向量表示,这些表示可以是节点的特征或者是经过嵌入的低维向量。
  • 注意力系数的计算:对于每一对节点,GAT通过一个可学习的函数(通常是一个小型的神经网络)来计算它们之间的注意力系数。这个系数决定了在聚合邻居节点信息时,每个邻居节点的重要性。
  • 加权特征聚合:每个节点会根据计算出的注意力系数,从其邻居节点中聚合信息。这意味着每个节点的更新表示是其邻居节点表示的加权和,权重即为注意力系数。
  • 多头注意力:为了增强模型的表达能力,GAT通常会采用多头注意力机制,类似于Transformer模型。通过多个独立的注意力机制并行处理信息,然后将结果聚合,可以提高学习的稳定性和性能。
  • 非线性激活:聚合完邻居节点信息后,通常会应用非线性激活函数(如ReLU),以增加模型的非线性表达能力。

Liu Y, Zhang M, Ji D. End to end Chinese lexical fusion recognition with sememe knowledge[J]. arXiv preprint arXiv:2004.05456, 2020.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/774526.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

敏捷产品经理实训:成为高效产品领导者的秘诀

敏捷产品经理实训:成为高效产品领导者的秘诀​ 在当今快节奏的市场环境中,产品经理和产品负责人需要快速响应市场变化,推动产品创新,以满足用户不断变化的需求。敏捷产品经理实训课程专为产品经理和产品负责人设计,旨在帮助他们掌握敏捷方法,提高团队协作和产品开发效率,…

P2163 [SHOI2007] 园丁的烦恼 题解

题目传送门 题目大意: 在一个平面直角坐标系上,给定 \(n\) 个点的坐标 \((x,y)\),\(m\) 次询问,每次询问一个矩形范围内的点的数量,此矩形用 \(\{a, b, c, d\}\) 来描述,其中 \((a, b)\) 为左下角,\((c, d)\) 为右上角。 思路: 不难将题目转化为:给定一个长度为 \(n\)…

金牌AI销售机器人,轻松直翻业绩!

本文由 ChatMoney团队出品老板们,你们现在的压力是不是越来越大了?员工和往年是一样的,但是业绩却比往年差一半! 尤其是电商行业,是“优化”员工还是广招人才?人工成本都很高。还得把业绩拉上去?怎么办呢? 目前我们采用Chatmoney全能知识库AI销售系统,用人工智能来实现…

S32G3任务抢占

通过S32G3 的STM定时器 实现任务任务抢占 1、创建一个空工程 2、创建完成后先生成一版代码 3、编译 4、添加user文件夹来存放自己的代码my_os.h/*********************************************************************************************************************/ /…

我们的网站被狗爬了!

大家好,我是程序员鱼皮。 世风日下,人心不古。我们的程序员面试刷题网站 《面试鸭》 才刚刚上线了一个多月,就由于过于火爆,被不少同行和小人发起网络攻击。 而且因为我们已经有 4500 多道人工整理的企业高频面试题、100 多个各方向的面试题库、大厂面试官原创的优质题解,…

Nmap 7.95 - Zenmap 汉化版,端口扫描、网络嗅探工具

Nmap 7.95 - Zenmap 汉化版 本来想找一个端口扫描工具,先找到了 Angry IP Scanner 用了一下,有时候扫不到,功能也比较单一。最后找到了 Nmap,这个功能要强大很多。网上没有最新的汉化版本,老版本的汉化还存在BUG,于是自己动手汉化了一下。功能介绍:Nmap是一款功能强大的…

TapData 信创数据源 | 国产信创数据库 TiDB 数据迁移指南,加速国产化进程,推进自主创新建设

本专题将以 TapData 正在支持的各国产信创数据源为原点,提供详细的数据库同步、迁移教程,为有需求的用户提供更灵活的工具选择。本文将介绍的 TapData 数据源为——TiDB。随着国家对自主可控的日益重视,目前在各个行业和区域中面临越来越多的国产化,采用有自主知识产权的国…

基于 LLM 制作了一个 SQL 方言转换器,未来的某天我可能会用上

事件起因,公司有从sqlserver转mysql的打算,源码里有不少sqlserver的语句,没有啥批量修改的好方法,人力解决最稳妥,所以基于大模型制作了一个方言转换器项目基于.NET6 MVC + Bootstrap 简单页面就没有去build前端了,jquery字符串拼接一把梭 项目已开源:https://github.co…

oracle产品周期

JDBC 下载链接:https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html

计算机入门和服务器入门知识总结

一、计算机入门知识 1.1 什么是计算机 是一种能接收和存储信息,并按照存储在其内部的程序对海量数据进行自动、高速地处理,然后把处理结果输出的现代化智能电子设备发明计算机的目标是代替人类去高效且高质量地完成工作。 1.2 计算机发展史第一代计算机(1946-1957) 电子管时代…

会议海报/论文海报编辑流程

模板网站 https://www.posterpresentations.com/free-poster-templates.html 选择感兴趣的模板,下载对应的尺寸比如下载第一个,想要改变颜色设计的话,在ppt中最上面点击“设计-变体更多-颜色”,可以整体更改模板颜色 如果想要修改模板背景色之类的,比如改成白色,点击“视…

汽车测试及质量监控博览会(中国)——北汇信息邀请函

尊敬的先生/女士: 北汇信息将于 8.28-30 号参加汽车测试及质量监控博览会,展位号:7028,诚邀您莅临展位进行参观交流!汽车测试及质量监控博览会(中国)2024汽车测试及质量监控博览会(中国)(Testing Expo China – Automotive)是引领世界的国际博览会,展示汽车测试、开发…