知识图谱在很多的真实的应用中都起着重要的作用,比如语义搜索、智能问答、文本理解等。通用知识图谱构建中最重要的数据源之一是百科类网站,比如维基百科、百 度百科等。如英文知识图谱 Freebase 最主要的数据源即是维基百科,大型中文通用知识图谱 CN-DBpedia 主要的数据源是百度百科、互动百科等中文类百科网站。知识图 谱相当于是现实世界的知识集合,这些知识并不是恒定不变的而是不断变化的,没有及时更新的知识图谱无法及时地捕获到已经变化的知识以及新出现的知识,而其数据源 百科类网站可以很及时的覆盖新的知识和变化的知识。一个未能及时更新的知识图谱会包含一些过时的知识、甚至是错误的知识,这会对知识图谱的下层应用的产生很大的 限制。因而一个很重要的问题就是如何对知识图谱进行更新,也就是使得知识图谱和其数据源进行同步,这里的数据源只考虑百科类网站。

对于大部分的知识图谱所采用的更新方式周期性批量更新,这种更新方式会有很多的弊端。其中一个弊端是在进行更新时的代价较大,百科类的网站通常会包含千万级别的实体,在每次周期批量更新时会花费大量的时间代价,以及会占用大量的网络带宽。另一个主要的弊端是在周期性更新的周期内,会不断有新知识的出现以及一些变化的知识,也就是周期性的更新方式也会导致知识图谱中包含一些过时的知识。为了解决以上两个问题,本文提出了智能知识图谱更新系统 S-USB,一个更加智能的知识图谱更新方案。

本文提出的智能知识图谱更新系统 S-USB 可以智能的识别出已发生变化的实体并仅更新这些实体。S-USB 的核心部分是一个实体更新频率预测器用于预测实体的更新频率,该实体更新频率预测器主要包括一系列高效的特征和回归器。我们做了一系列实验去检测本文提出的知识图谱智能更新系统 S-USB 以及实体更新频率预测器的效果,实验结果表明本文所提出的知识图谱更新系统 S-USB 可以有效地识别出变化的实体和新出现的实体。特别的,本文所提出的知识图谱智能更新系统已经在一些知识图谱中得到应用落地,其中包括最大中文知识图谱系统 CN-DBpedia。

本文的主要创新点主要有以下几点:

    1. 智能更新系统:本文针对知识图谱的更新问题创新性地提出了智能主动知识图谱更新系统 S-USB,以较小的代价保持知识图谱时效性。
    1. 实体更新频率预测器:本文提出一种实体更新频率预测模型,其中包含了一系列高效的特征和回归器,该预测器可以有效的提高更新系统的准确率。
    1. 更新系统应用落地:本文将智能更新系统已经应用到真实的知识图谱的更新中,有效地提高了知识图谱的时效性,并且可以使得比较热门的实体的知识总是处于最新的状态。
成为VIP会员查看完整内容
知识图谱更新技术研究及其应用.pdf
103

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
74+阅读 · 2020年5月30日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
86+阅读 · 2020年5月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
【ICLR2020-Facebook AI】张量分解的时序知识图谱补全
专知会员服务
58+阅读 · 2020年4月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
万字长文| 中文知识图谱构建技术以及应用的综述
中国人工智能学会
70+阅读 · 2019年9月9日
干货 | 知识图谱的技术与应用
深度学习与NLP
18+阅读 · 2018年6月15日
领域应用 | 知识图谱的技术与应用
开放知识图谱
17+阅读 · 2018年6月14日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
论文动态 | 基于知识图谱的问答系统关键技术研究 #02
开放知识图谱
10+阅读 · 2017年8月6日
论文动态 | 基于知识图谱的问答系统关键技术研究 #04
开放知识图谱
10+阅读 · 2017年7月9日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关VIP内容
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
74+阅读 · 2020年5月30日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
86+阅读 · 2020年5月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
【ICLR2020-Facebook AI】张量分解的时序知识图谱补全
专知会员服务
58+阅读 · 2020年4月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关资讯
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
万字长文| 中文知识图谱构建技术以及应用的综述
中国人工智能学会
70+阅读 · 2019年9月9日
干货 | 知识图谱的技术与应用
深度学习与NLP
18+阅读 · 2018年6月15日
领域应用 | 知识图谱的技术与应用
开放知识图谱
17+阅读 · 2018年6月14日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
论文动态 | 基于知识图谱的问答系统关键技术研究 #02
开放知识图谱
10+阅读 · 2017年8月6日
论文动态 | 基于知识图谱的问答系统关键技术研究 #04
开放知识图谱
10+阅读 · 2017年7月9日
微信扫码咨询专知VIP会员