©PaperWeekly 原创 · 作者 | 吴俊康
学校 | 中国科学技术大学硕士生
研究方向 | 信息检索
论文标题:
DisenKGAT: Knowledge Graph Embedding with Disentangled Graph Attention Network
论文作者:
吴俊康(中国科学技术大学),石文焘(中国科学技术大学),曹雪智(美团),陈佳伟(中国科学技术大学),雷文强(新加坡国立大学),张富峥(美团),武威(美团),何向南(中国科学技术大学)
论文链接:
https://arxiv.org/pdf/2108.09628.pdf
收录会议:
CIKM 2021
摘要
知识图谱补全近年来受到学术界和业界的广泛关注。然而现有的方法只将图谱中的实体表征成单独的静态的一个向量,这限制了模型的表达能力,特别是难以捕捉图谱中的复杂的关系。基于此,我们提出了一个知识图谱解耦表征方法,将每个实体表征为多个独立的向量,从而提升模型的表达能力。一方面,我们在知识图谱卷积中引入关系感知信息聚合机制,促使表征的每个成分聚合到不同的信息,此部分实现了“微观解耦”;另一方面,我们通过添加互信息正则项来增强表征中每个成分之间的独立性,从而实现了“宏观解耦”。最后,我们在常用的两个基准数据集上验证了解耦表征可以有效的提升性能。
研究背景
知识图谱补全是知识图谱中最为基础且最为常见的任务之一,许多 AI 相关工作都需要依靠知识图谱的构建。现有模型(基于距离表征的模型、基于语义匹配的模型以及基于神经网络的模型)的常见思路是通过定义一个打分函数,期望其能较好地分辨出真实三元组与伪三元组;即真实样本的预测分数显著高于负样本。
我们研究过程中发现现有模型仍存在显著的问题:如一对多 (1-N)、多对一 (N-1) 与多对多关系(N-N)的预测。举例来说,如图 1 所示,国籍就是一种典型的多对一关系,即每个人都只有唯一的一种国籍,而成千上万的人都拥有相同的国籍。将询问(科比,职业,?)和询问(比尔盖茨,职业,?)进行分析举例,由于两人物的国籍均上美国,因此上述模型会将科比和比尔盖茨两实体拉近以共享国籍美国这一信息。而针对职业这一关系,两者差异巨大,直觉是应该疏远两者,并无明显相关性,显然静态且唯一的表征会显著影响图谱补全的效果。换言之,上述经典模型无法根据场景的动态变化生成不同的适应性表征。
针对上述案例中选取例子,本文总结现存模型的劣势如下:
1. 简单的聚合邻居信息无法有效提取建模关键的邻居边信息,其中邻居边信息往往蕴含着实际预测的场景。本文认为同一实体在不同场景下应当展现出不同的表征含义。
2. 上述模型往往忽视了实体嵌入表征背后往往存在隐因子的耦合。如下图2所示,科比和不同场景下的信息都有邻接关系,比如职业部分、荣誉部分、家庭信息以及地域信息。假设有一个询问时关于科比的儿子信息,显然我们期望模型将更多的重心侧重于他家庭属性下的邻居,如他的妻子以及他的女儿,而不是一些他的工作他的荣誉等无关主题等属性信息。
3. 根据上述两点,之前模型将会导致模型的可解释较低以及鲁棒性较低。现有模型生成的单一、静态化表征将导致其在提取邻居信息的过程中抹除了关键的结构信息和文本语义信息。
在本文中,我们通过引入基于解耦表征的学习框架以解决上述问题。知识图谱解耦的核心思想为:通过将实体不同主题语义表示进行拆分解耦,根据给定查询针对性匹配相应主题化语义表示进行嵌入预测,以实现不同场景下动态化表示,从而有效解决复杂多语义知识图谱表示补全。
研究现状和相关工作
现有知识图谱补全模型可分为三类:基于距离表征的模型、基于语义匹配的模型以及基于神经网络的模型。三者都遵循定义一个打分函数衡量真实样本合理性与否的研究范式。后续根据其缺乏对图结构信息的挖掘,逐步引入图神经网络(GCN)[2][3][4],并形成一个“encoder-decoder”的研究范式,即在 encoder 中通过 GCN 挖掘图结构信息,后续 decoder 中利用现有的打分函数进行预测。然而现有模型仍然是建模单一静态化实体表征,无法有效解决一对多(1-N)、多对一(N-1)与多对多关系(N-N)的预测。
近两年部分模型也尝试解决上述问题,如 [5][6][7] 等提供了 relation-specific projections 帮助实体根据 relation 进行特异性嵌入。而 Coke[8] 则是引入 transformer 动态化挖掘上下位信息。FAAN[9] 利用动态注意力网络与 transformer 有效匹配查询实体。尽管上述问题已经存在部分尝试,如何从解耦角度进行思考解决仍没有正式的讨论。
解耦表征学习是通过挖掘数据背后隐因子的分离化表征从而有效建模复杂场景,其相应应用已经在文本、计算机视觉等有大量尝试。而在图 (graph) 领域,DisenGCN[10] 是首次在图数据挖掘中引入解耦的思想,其通过一个邻居循迹策略(neighborhood routing strategy)对图子语义信息进行了尝试建模。后续为解决其缺乏解耦因子分散的独立性限制,IPGDN[11] 和 ADGCN[12] 分别利用 Hilbert-Schmidt Independence Criterion (HSIC) 以及对抗网络对其进行正则化限制。核心是保证各个子语义表示互相独立,防止训练过程中子语义表示再次耦合。上述模型均为简单同构图中的尝试,DisenHAN[13] 则是专注在异构图解决上述问题。
本任务提出的模型整体框架如图 3.1 所示:整体模型包含三个关键部分:1)关系感知信息聚合机制,此部分实现了微观解耦;2)独立性限制,此部分通过添加互信息正则项实现了宏观解耦;3)动态打分预测。其中每种通道(颜色)代表一种特定的子部分信息,并且不同通道之间保持独立。最终的结果需要根据各通道的预测结果再根据当前场景与各通道的相似程度判断给出最终的预测分数排名。
参考文献
[1] Diego Marcheggiani and Ivan Titov. 2017. Encoding sentences with graph convolutional networks for semantic role labeling. arXiv preprint arXiv:1703.04826(2017)
[2] Michael Schlichtkrull, Thomas N Kipf, Peter Bloem, Rianne Van Den Berg, IvanTitov, and Max Welling. 2018. Modeling relational data with graph convolutional networks. In European semantic web conference. Springer, 593–607.
[3] Chao Shang, Yun Tang, Jing Huang, Jinbo Bi, Xiaodong He, and Bowen Zhou.2019. End-to-end structure-aware convolutional networks for knowledge base completion. In Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 33.3060–3067.
[4] Shikhar Vashishth, Soumya Sanyal, Vikram Nitin, and Partha Talukdar. 2019.Composition-based multi-relational graph convolutional networks. ICLR2020.
[5] Guoliang Ji, Shizhu He, Liheng Xu, Kang Liu, and Jun Zhao. 2015. Knowledge graph embedding via dynamic mapping matrix. In ACL2015
[6] Yankai Lin, Zhiyuan Liu, Maosong Sun, Yang Liu, and Xuan Zhu. 2015. Learning entity and relation embeddings for knowledge graph completion. AAAI2016.
[7] Zhen Wang, Jianwen Zhang, Jianlin Feng, and Zheng Chen. 2014. Knowledge graph embedding by translating on hyperplanes. AAAI2015
[8] Quan Wang, Pingping Huang, Haifeng Wang, Songtai Dai, Wenbin Jiang, JingLiu, Yajuan Lyu, Yong Zhu, and Hua Wu. 2019. Coke: Contextualized knowledge graph embedding. arXiv preprint arXiv:1911.02168(2019).
[9] Jiawei Sheng, Shu Guo, Zhenyu Chen, Juwei Yue, Lihong Wang, Tingwen Liu, and Hongbo Xu. 2020. Adaptive Attentional Network for Few-Shot Knowledge Graph Completion. arXiv preprint arXiv:2010.09638(2020).
[10] Jianxin Ma, Peng Cui, Kun Kuang, Xin Wang, and Wenwu Zhu. 2019. Disentangled graph convolutional networks. In International Conference on Machine Learning. PMLR, 4212–4221.
[11] Yanbei Liu, Xiao Wang, Shu Wu, and Zhitao Xiao. 2020. Independence promoted graph disentangled networks. In Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 34. 4916–4923.
[12] Shuai Zheng, Zhenfeng Zhu, Zhizhe Liu, Shuiwang Ji, and Yao Zhao. 2021. Adversarial Graph Disentanglement. arXiv preprint arXiv:2103.07295(2021).
[13] Yifan Wang, Suyao Tang, Yuntong Lei, Weiping Song, Sheng Wang, and MingZhang. 2020. DisenHAN: Disentangled Heterogeneous Graph Attention Network for Recommendation. CIKM2020.
[14] Pengyu Cheng, Weituo Hao, Shu yang Dai, Jiachang Liu, Zhe Gan, and Lawrence Carin. 2020. CLUB: A Contrastive Log-ratio Upper Bound of Mutual Information. 2020ICML.
特别鸣谢
感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:hr@paperweekly.site
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧