论文浅尝 | 基于多原型mention向量的文本-实体联合学习

2018 年 5 月 3 日 开放知识图谱 王冠颖

链接http://anthology.aclweb.org/P/P17/P17-1149.pdf

 

概述

在知识库和文本的联合表示中,歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体,同一个实体又有多种 mention 表示,如下图。本文提出了一个新的表示方法,可以在一个联合空间学习 mention 和实体的表示,同时解决歧义问题。


模型

作者提出了一个 mention sense 的概念,每一个 mention 对应一个 mention_sense,以表示当前的mention的真正含义。可以看出,mention_sense 是和实体一一对应的。作者从 wikipedia 的超链接里提取出 <m_l, e_j> 的组合,即mention超链接到某一实体。对于每一个这种组合,作者把它映射到一个 mention_sense 上:


这样同一实体的 mention 会共享 mention_sense,而同一 mention 对应不同实体也会映射到不同的 mention_sense。作者把文本中的 mentionmention_sense 代替,来进行联合训练。

像大图的最右侧部分描述的一样,mention_sense 可以看成是文本空间和实体空间的一个链接。联合训练的似然函数由三部分组成,均采用 CBOW/skip-gram 的语言模型来得到向量:

1、实体空间


这个方法让共享邻居实体的实体词尽可能相似。

2mention空间

这个方法使得指向同一实体,且共享上下文的mention_sense尽可能相似。

3、文本空间

共现的词之间应尽可能相似,类似于 word2vec,只不过用 mention_sense 代替 mention

 

实体链接

用上述学出的向量可以进行实体链接的工作。对于每一个实体,对所有 mention_sense 做如上计算,选出概率值最大的 mention_sense,再连接到对应的实体。因为一个句子可能包含多个实体,而全局优化代价过大,为了方便,作者假设实体和实体间独立,提出了 L2R(从左至右)和 S2C(从简至繁)的逐实体预测的方法。

 

实验

作者进行了自身对比,可以看出多实体比单一实体的效果好很多。

在实体相关预测和词语相关预测上,实体和词语联合学习的方法,也比单一学习提升了一些性能。

最后是上述实体链接的尝试:


笔记整理:王冠颖,浙江大学硕士,研究方向为关系抽取、知识图谱。




OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。


点击阅读原文,进入 OpenKG 博客。

登录查看更多
9

相关内容

实体(entity)是有可区别性且独立存在的某种事物,但它不需要是物质上的存在。尤其是抽象和法律拟制也通常被视为实体。实体可被看成是一包含有子集的集合。在哲学里,这种集合被称为客体。实体可被使用来指涉某个可能是人、动物、植物或真菌等不会思考的生命、无生命物体或信念等的事物。在这一方面,实体可以被视为一全包的词语。有时,实体被当做本质的广义,不论即指的是否为物质上的存在,如时常会指涉到的无物质形式的实体-语言。更有甚者,实体有时亦指存在或本质本身。在法律上,实体是指能具有权利和义务的事物。这通常是指法人,但也包括自然人。
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
近期必读的5篇 WSDM 2020【图神经网络(GNN)】相关论文
专知会员服务
56+阅读 · 2020年1月10日
论文浅尝 | GraphIE:基于图的信息抽取框架
开放知识图谱
17+阅读 · 2019年6月2日
论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型
开放知识图谱
31+阅读 · 2019年4月7日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
论文浅尝 | 通过多原型实体指称向量关联文本和实体
开放知识图谱
7+阅读 · 2018年6月21日
论文浅尝 | 基于RNN与相似矩阵CNN的知识库问答
开放知识图谱
8+阅读 · 2018年5月29日
论文浅尝 | 基于置信度的知识图谱表示学习框架
开放知识图谱
24+阅读 · 2018年2月27日
论文浅尝 | CFO: Conditional Focused Neural Question Answering
开放知识图谱
6+阅读 · 2017年12月15日
VIP会员
相关资讯
论文浅尝 | GraphIE:基于图的信息抽取框架
开放知识图谱
17+阅读 · 2019年6月2日
论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型
开放知识图谱
31+阅读 · 2019年4月7日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
论文浅尝 | 通过多原型实体指称向量关联文本和实体
开放知识图谱
7+阅读 · 2018年6月21日
论文浅尝 | 基于RNN与相似矩阵CNN的知识库问答
开放知识图谱
8+阅读 · 2018年5月29日
论文浅尝 | 基于置信度的知识图谱表示学习框架
开放知识图谱
24+阅读 · 2018年2月27日
论文浅尝 | CFO: Conditional Focused Neural Question Answering
开放知识图谱
6+阅读 · 2017年12月15日
Top
微信扫码咨询专知VIP会员