笔记整理 | 谭亦鸣,东南大学博士生
来源:EACL’21
链接:https://www.aclweb.org/anthology/2021.eacl-main.35.pdf
本文提出了一种基于递归超图的知识图谱问答方法RecHyperNet,作者认为人回答问题时倾向于在推理过程中递归地对获取的不同知识(object)随时进行归类(grouping),而超图(hypergraph)则可以作为一个关系归类建模的工具。在现有的问答方法里,对于给定知识库的递归关系归类并没有被明确的作为问答过程的一环,因此为了验证这种贴近于人类思维的方式是否能够为自动问答带来收益,作者提出了上述方法(Recursive Hypergraph Network),并在MateQA和WebQuestionSP的两个数据集上验证了该方法的有效性。
作者通过以下两个定义描述超图:
首先,作者定义了
接着是对
在图结构上,一般的边由两个节点所定义,而超边则可以由三个或更多的节点所定义,例如下图就是一个每条边包含三个节点的三阶超图:
通过对获取图谱中的幂集,形成超边,作者可以将图谱中经过相同头实体和关系的尾实体表示在一条超边上,反之亦然,也就形成了grouping的效果,我是这样理解的。
实际效果上,作者举了个例子:
存在以下三元组:
盗梦空间,明星,Leonardo
盗梦空间,明星,Ellen
盗梦空间,明星,Tom
对应的超边:
(盗梦空间,明星),(Leonardo,Ellen,Tom)
基于超图,作者提出了RecHyperNet模型,包含三个主要部分:
1.KB embedding:
对图谱实体的初始化表示学习,这里直接是使用了TransE和ComplEX
2.Topic and Question embedding
通过使用LSTM/RoBERTa对问题进行表示学习,问题中的Topic实体则使用了一个在KB上的multi-relational 图卷积网络CompGCN来表示,该模型中,实体的更新通过以下公式2实现:
其中,N(v)表示实体v的一跳邻居(的关系和尾实体pair),f是个非线性激活函数ReLU,x与z分别表示实体和关系的初始特征向量。
这里作者的关键性改进就是将激活函数f中的一阶实体关系特征改变为超边特征,即将一条边一个一跳邻居的模式变为一堆具有同头实体与关系的三元组构成的(最大)超边。
3.Answer select
给定一个KB embedding打分函数以及一组候选答案,使用该函数对答案与问题及主题的相关性做量化评价:
截至目前,该结果已经不是MateQA和WebQSP上的sota,但是其结果体现出了hypergraph这一新的特征表示形式所带来的收益,这一点则相对更有价值。
References
[1]
他人的理解: https://blog.csdn.net/m0_37683327/article/details/91048782
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。