常识知识图谱(CKG)如Atomic和ASER等大大有别于传统知识图谱KG,包含由松散结构化文本组成的大规模节点,。CKG能够在自然语言处理高度多样化的查询,但这也导致自动CKG构建的独特挑战。除了识别KG中没有的节点之间的关系外,构建方法还将探索文本中缺失的节点,其中可能会出现不同的现实世界的事物或实体。为了处理现实世界中涉及常识的无数实体,我们引入CKG构造方法概念化,即将文本中提到的实体视为特定概念的实例,反之亦然。我们通过概念化来建立合成三元组,并进一步将其表示为三元分类,由一个从预训练语言模型中转移知识并通过负抽样进行微调的判别性模型来处理。实验结果表明,该方法能够有效地识别可能三元组,并将新节点和新边的KG值同时扩大三倍,具有较高的多样性和新颖性。
https://arxiv.org/abs/2003.03239
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“CCKG” 就可以获取《论概念化在常识知识图构建中的作用,Commonsense Knowledge Graph》专知下载链接