论文浅尝 | Knowledge Vault: 全网规模的知识概率融合方法

2019 年 3 月 11 日 开放知识图谱

论文笔记整理:吴桐桐,东南大学博士生,研究方向为自然语言处理。



链接:https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf

 

基于机器学,Knowledge Vault不仅能从多个来源(文本,表格数据,构,人工注)中提取数据,而且可以根据所有可用数据推断事和关系。网当然包含大量的错误数据,因此框架依有的知识库(例如Freebase),以便在程的其中一个步验证。研究人该过程描述图中的链接预测”,并试图采用两种不同的方法来解决它:a)路径排序算法(PRA)和b)神模型(MLP)[1]

 

结构

Knowledge Vault主要由以下三个主要构件成:

1.    提取器 - 从大型数据集中提取三元(主谓语象)并分配置信度分数。

2.    基于形的先 - 从有知识库中学

3.    融合 - 事概率的最得分

通过结合现有知识库和自身提取过程中的数据,研究人员已设法减少事实不确定性的数量,如下图所示:

Knowledge Vault 相比于知识图谱的优势

Knowledge Vault 对当前知识图的关键优势在于其设计允许其扩展。到目前为止,Knowledge Vault设法推断了大约 271,000,000可信的事实,这些事实被认为是真实的,至少有90%的可能性。为了提炼这些事实,Knowledge Vault 提取了 1,600,000,000 三元组,4469种关系类型和1100种实体。

关于知识图谱的思考

本文作为知识图谱领域的核心论文之一,文中所提出的几点思考放在论文发表5年之后的今天仍具有借鉴意义。

 

1.如何建模事实之间的互斥性:目前,我们将每个事实视为独立的二进制随机变量,无论是真是假。然而在现实中许多三元组之间是互斥的。

2.建模事实之间的软相关性:对于某些关系,它们的价值将受到软约束。如某个人物的出生时间一定在其父母出生时间的至少10年之后。

3.值可以在多个抽象层次上表示:我们可以用不同的粒度来表示世界。

4.如何处理相关的数据源:当数据源数目较多且相互重叠时,则需要考虑更复杂的数据拷贝机制。

5.有些事实只是暂时的事实。在某些情况下,事实的“真相”可能会改变。例如,谷歌目前的首席执行官是拉里·佩奇,但从2001年到2011年,他就是埃里克·施密特。这两个事实都是正确的,但只是在指定的时间间隔内。

6.如何发现并添加新实体和关系。除了遗漏的事实之外,还有许多实体在网络上被提及,但不在Freebase中,因此也不在 knowledge vault 中。

 



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

登录查看更多
8

相关内容

知识库(Knowledge Base)是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算 机存储器中 存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定 理和运算法则以及常识性知识等。
【ICLR2020-Facebook AI】张量分解的时序知识图谱补全
专知会员服务
58+阅读 · 2020年4月14日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的自然语言理解 02#
开放知识图谱
8+阅读 · 2019年2月24日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
论文浅尝 | 面向简单知识库问答的模式修正强化策略
开放知识图谱
3+阅读 · 2018年11月7日
论文浅尝 | 用可微的逻辑规则学习完成知识库推理
开放知识图谱
14+阅读 · 2018年7月5日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
14+阅读 · 2019年11月26日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
29+阅读 · 2018年4月6日
VIP会员
相关资讯
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的自然语言理解 02#
开放知识图谱
8+阅读 · 2019年2月24日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
论文浅尝 | 面向简单知识库问答的模式修正强化策略
开放知识图谱
3+阅读 · 2018年11月7日
论文浅尝 | 用可微的逻辑规则学习完成知识库推理
开放知识图谱
14+阅读 · 2018年7月5日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
相关论文
Arxiv
101+阅读 · 2020年3月4日
Arxiv
14+阅读 · 2019年11月26日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
29+阅读 · 2018年4月6日
Top
微信扫码咨询专知VIP会员