走进知识图谱(二)【世界知识图谱篇】知识表示的经典模型与平移模型及基于复杂关系建模的知识表示学习

        上篇文章提到,该系列文章将主要围绕世界知识图谱和语言知识图谱这两大类知识图谱进行展开,并且提到知识图谱的主要研究包括了知识表示学习、知识自动获取和知识的推理与应用三大部分。今天主要介绍世界知识图谱的知识表示学习,其中包括经典的知识表示学习模型、平移模型和平移模型的一个变种——基于复杂关系建模的知识表示学习。

        知识表示学习

        知识图谱的知识表示主要解决的问题就是:如何把知识图谱中结构化的知识更好的表示成计算机可以高效率处理应用的形式。因为知识图谱中的结构化知识虽然对于人类来讲看上去很好理解,但是其本身的图结构,对于计算机来说是很难利用的。因此,把知识图谱中的知识表示成计算机易于处理的低维稠密向量,不仅可以方便计算机高效处理,还可以解决原本知识图谱中表示存在的结构稀疏的问题。而知识图谱中的主要内容包括实体和关系两者,因此知识图谱的知识表示的核心就是:对知识图谱中的实体和关系,以及实体和关系之间的联系这三者进行表示,并且是表示成低维稠密向量。

        知识表示存在以下几个问题:1. 实体和关系的种类众多 2. 实体和关系的形式众多 3. 以上两者导致的知识图谱中的实体和关系不准确针对知识表示存在的问题。

        研究人员的研究方案也就包括:1. 如何充分表示不同的实体和关系,以及解决其中的不准确信息 2. 如何把同一个实体和关系的不同形式表现出来,即融入世界知识在不同形式的信息载体中的信息。

        知识表示学习旨在将实体与关系表示为低维连续空间之中的向量,在此使用粗体的符号 h, t,r 表示头尾实体与关系对应的表示向量。

知识表示学习的经典模型

        知识表示的经典模型主要包括:结构向量模型(Structure Embedding,SE)、语义匹配能量模型(Semantic Meaching Energy,SME)、隐变量模型(Latent Factor Model,LFM)、矩阵分解模型(RESCAL及其改进HolE)。

1. 结构向量模型结构向量模型为头实体与尾实体分别设计了一个关系特化的映射矩阵 r, Mr, ,这些映射矩阵将会在训练过程中进行自动更新。模型对每个三元组(h,r,t)的评分函数定义为:

E(h,r,t)=∥M r,1​ h−M r,2t∥

|| || 是欧式距离,其公式是:d(x,y) = sqrt( (x1-y1)^2 + (x2-y2)^2 + ... + (xn-yn)^2 )。M r,1​·h是实体h在关系r下的嵌入向量,M r,2·t是实体t在关系r下的嵌入向量。这里的意思是,两个实体之间在关系r下的距离,等于两个实体的嵌入向量在关系r的映射矩阵下的欧式距离。欧式距离越小,两个实体的距离越小。即这两个实体和关系r之间联系非常大。

2. 语义匹配能量模型语义匹配能量模型与结构向量模型不同,使用低维向量表示实体及关系。在此之上,模型使用矩阵映射、点乘等操作,对实体与关系的联系进行评估。具体地,语义匹配能量模型设计了线性形式与双线性形式两种对元组的评分函数。

E(h,r,t)=(M1​h+M2​r+b1​)⊤(M3​t+M4​r+b2​)

E(h,r,t)=((M1​h⊙M2​r)+b1​)⊤((M3​t⊙M4​r)+b2​)

其中,⊙是element-wise(Hadamard)积;M1, M2, M3, M4是投影函数的权重矩阵,b1, b2是偏置。
3. 隐变量模型隐变量模型将实体表示成低维向量。将关系表示为双线性变换矩阵Mr ,在知识表示学习效果与计算复杂度方面都有显著改善。模型的评分函数为:

E(h,r,t) = hMrt

4. 矩阵分解模型。矩阵分解模型基于矩阵分解的方式进行知识表示学习,其中以 RESCAL模型和HolE模型为代表。

平移模型(TransE)

        平移的思想在Bordes 等研究者在2013年提出知识表示学习算法平移模型TransE之前就被广泛应用,以Word2Vec为例。它是Google AI 2013年提出的一种词向量模型,它通过训练一个神经网络来学习词之间的联系,并将词映射到一个低维空间中。平移模型将实体和关系映射至同1个低维向量空间,将实体与实体之间的关系表示为实体之间的平移操作。 

 平移模型的思想就是两个头尾实体可以表示成一个实体向量等与另一个实体向量与关系向量的和。其评分函数为:

E(h, r, t) = ||  h + r - t || L1/L2

由于只考虑了向量之间的平移操作,平移模型的计算复杂度大大降低并且学到的知识表示在知识图谱补全等任务方面的效果也得到了显著提升。但是其也存在:

  • 过于理想化的平移假设,在对知识图谱中的复杂关系进行建模时往往存在问题
  • 仅仅关注知识图谱三元组的局部信息,而忽略了知识图谱网络的全局结构与关系之间的推理逻辑
  • 只关注了知识图谱自身的网络结构信息,忽略了众多多源异质的丰富信息,如文本、实体类型与图像等信息

等问题,因此研究人员陆续提出了多个基于平移模型TransE的改进模型,下面先介绍一种基于复杂关系建模的知识表示学习。

基于复杂关系建模的知识表示学习

        TransE模型(经典的平移模型)无法解决复杂关系建模的问题,因为它只能对1对1的关系进行建模,对于1对多和多对多的关系则无法建模。而其改进模型TransR则可以很好的解决该问题。

TransR 与传统模型的主要差异在于它为 每种关系定义了单独的语义空间 ,并使用不同的映射矩阵 Mr 定义从实体空间到各个关系空间的映射。

TransR可以让每个实体针对每个关系有不同的映射结果,可以很好的解决1对多和多对多的关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/63805.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用C语言实现UDP消息接收

目录 简介:步骤:步骤 1: 创建套接字步骤 2: 接收消息步骤 3: 完成 函数及变量解释总结: 简介: 在网络通信中,UDP(User Datagram Protocol)是一种无连接协议,它提供了一种快速、高效的数据传输方法。本文将向您展示如何使用C语言编…

Spring Bean 生命周期的执行流程

问题描述 Spring 生命周期全过程大致分为五个阶段: 1、创建前准备阶段 2、创建实例阶段 3、依赖注入阶段 4、 容器缓存阶段 5、销毁实例阶段 下图是 Spring Bean 生命周期完整流程图,其中对每个阶段的具体操作做了详细介绍: 一、创建前准备阶…

栈和队列详解

目录 栈 栈的概念及结构: 栈的实现: 代码实现: Stack.h stack.c 队列: 概念及结构: 队列的实现: 代码实现: Queue.h Queue.c 拓展: 循环队列(LeetCode题目链接&#xff0…

每天一道leetcode:516. 最长回文子序列(动态规划中等)

今日份题目: 给你一个字符串 s ,找出其中最长的回文子序列,并返回该序列的长度。 子序列定义为:不改变剩余字符顺序的情况下,删除某些字符或者不删除任何字符形成的一个序列。 示例1 输入:s "bbb…

【高频面试题】JVM篇

文章目录 一、JVM组成1.什么是程序计数器2.什么是Java堆?3.能不能介绍一下方法区(元空间)4.你听过直接内存吗5.什么是虚拟机栈6.垃圾回收是否涉及栈内存?7.栈内存分配越大越好吗?8.方法内的局部变量是否线程安全?9.什么…

【技巧】如何保护PowerPoint不被改动?

PPT,也就是PowerPoint,是很多小伙伴在工作生活中经常用到的图形演示文稿软件。 做好PPT后,担心自己不小心改动了或者不想他人随意更改,我们可以如何保护PPT呢?下面小编就来分享两个常用的方法: 1. 将PPT改…

吉利科技携手企企通,打造集团化数智供应链系统

近日,吉利科技集团有限公司(以下简称“吉利科技”)联合企企通成功召开SRM采购供应链管理项目启动会。企企通与吉利科技高层、项目负责人与团队成员出席此次启动会。 双方将携手在企业供应商全生命周期管理、采购全流程、电子招投标、采购分析…

阿里云预装LAMP应用导致MySQL不显示访问密码如何解决

😀前言 本篇博文是关于阿里云云服务器ECS部署MySQL过程中出现的一下坑,希望能够帮助到您😊 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大家…

【问题解决】Git命令行常见error及其解决方法

以下是我一段时间没有使用xshell,然后用git命令行遇到的一些系列错误和他们的解决方法 遇到了这个报错: fatal: Not a git repository (or any of the parent directories): .git 我查阅一些博客和资料,可以解决的方式: git in…

C++笔记之字节数组的处理

C笔记之字节数组的处理 code review! 文章目录 C笔记之字节数组的处理1.字节数组打印2.将字节数组转换为十六进制字符串并打印3.将字符串转为字节数组4.将字节数组转为字符串5.字节数组和字符数组的区别6.字节数组用于二进制数据存储7.字节数组用于网络通信数据传输8.使用 un…

邵阳人自己的民国风情街终于来了!随手一拍即是大片!

在邵阳这座美丽的城市,拥有许多非常有意思并且值得打卡的游玩景区,“丹霞之魂,国之瑰宝”的崀山、“南方呼伦贝尔”之称的高山苔地草原、被联合国誉为“神奇绿洲”的遂宁黄桑等等都是成都这座城市的代表,但在邵阳最有民国风情韵味…

SQL | 注释

2-注释 2.1-单行注释 select prod_name -- 这是一条行内注释 from products; 使用两个连字符(-- ) 放在行内,两个连字符后的内容即为注释内容。 # 这是一条注释 select prod_name from products; 这种注释方式可能有些数据库不支持,所以使用前应该…