分类法是各种领域中许多真实世界应用的基础,可以作为知识的结构表示。为了处理需要作为分类法组织起来的越来越多的新概念,研究人员转而使用新概念自动补全现有的分类法。本文提出了一种新的分类法补全框架TaxoEnrich,该框架有效地利用了现有分类法中的语义特征和结构信息,并提供了更好的候选位置表示,以提高分类法补全的性能。具体而言,TaxoEnrich由四个部分组成:(1)基于强大的预训练的语言模型,将概念语义和分类关系结合起来的分类上下文嵌入;(2)分类感知序列编码器,通过对分类结构信息进行编码来学习候选位置表示;(3)查询感知兄弟编码器,根据候选兄弟编码对查询位置匹配的重要性,自适应聚合候选兄弟编码以增强候选位置表示;(4)用我们的新候选位置表示扩展了现有工作的查询-位置匹配模型。在来自不同领域的四个大型真实数据集上进行的大量实验表明,TaxoEnrich在所有评价指标中获得了最好的性能,并且大大超过了以前最先进的方法。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“TAEH” 就可以获取《【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全》专知下载链接