摘要 随着谷歌知识图谱、DBpedia、微软 Concept Graph、YAGO 等众多知识图谱的不断出现, 根据 RDF 来构建的知识表达体系越来越为人们所熟知. 利用 RDF 三元组表达形式成为人们对现实世界中 知识的基本描述方式, 由于其结构简单、逻辑清晰, 所以易于理解和实现, 但也因为如此, 当其面对现 实中无比繁杂的知识和很多常识时, 往往也无法做到对知识的认识面面俱到, 知识图谱的构建过程注 定会使其中包含的知识不具有完整性, 即知识库无法包含全部的已知知识. 此时知识库补全技术在应 对此种情形时就显得尤为重要, 任何现有的知识图谱都需要通过补全来不断完善知识本身, 甚至可以 推理出新的知识. 本文从知识图谱构建过程出发, 将知识图谱补全问题分为概念补全和实例补全两个 层次: (1) 概念补全层次主要针对实体类型补全问题, 按照基于描述逻辑的逻辑推理机制、基于传统机 器学习的类型推理机制和基于表示学习的类型推理机制等 3 个发展阶段展开描述; (2) 实例补全层次 又可以分为 RDF 三元组补全和新实例发现两个方面, 本文主要针对 RDF 三元组补全问题沿着统计 关系学习、基于随机游走的概率学习和知识表示学习等发展阶段来阐述实体补全或关系补全的方法. 通过对以上大规模知识图谱补全技术研究历程、发展现状和最新进展的回顾与探讨, 最后提出了未来 该技术需要应对的挑战和相关方向的发展前景.
关键词 知识图谱, 知识库补全, 概念补全, 实例补全
http://kns.cnki.net/kcms/detail/11.5846.TP.20200413.1620.003.html
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“KGCA” 就可以获取《【人大】大规模知识图谱补全技术的研究进展》专知下载链接