AutoML如何用于KG？清华等TPAMI2022《知识图谱学习的双线性评分函数搜索》自动设计图谱评分函数学习复杂KG语义

2022 年 4 月 25 日 专知

清华大学电子系机器学习课题组与第四范式和香港科技大学合作论文《知识图谱学习的双线性评分函数搜索》（Bilinear Scoring Function Search for Knowledge Graph Learning）近期发表于IEEE模式分析和机器智能学报（IEEE Transactions on Pattern Analysis and Machine Intelligence ，IEEE TPAMI）。

该论文提出的AutoBLM方法是第一个将AutoML运用到知识图谱学习技术中的工作。通过自动设计给定图谱的评分函数，挖掘语义信息更好的进行图谱建模，大幅降低复杂语义学习的门槛，并在多个任务上达到最优性能。该论文被TPAMI 2022录取，曾力克蚂蚁金服、斯坦福等研究团队，刷新大规模知识图谱榜单OGB记录。

论文链接： https://ieeexplore.ieee.org/document/9729658/

论文和OGB比赛复现代码 ：https://github.com/AutoML-Research/AutoSF

研究背景

随着AlphaGo在围棋比赛中超越人类冠军水平、AlphaFold在蛋白质三维结构分析上媲美专业设备，机器学习技术已受到整个社会的广泛关注。但是，相关技术缺乏了对真实世界中概念的理解和认识。与此同时，知识图谱则是一种自然包含人类对客观事物理解和认识的图结构化数据，可以有效连接人类对于真实世界的认知与计算机对于物理世界的建模。因此，随着机器学习技术的兴起，知识图谱也常常出现在各种应用中，如利用社交图谱理解人之间的关系、利用城市图谱做人流轨迹分析和利用医药图谱做药物互作用预测。

图表1 知识图谱（KG）示例

图1为一个简单的知识图谱示例，我们利用图中的朋友关系，兴趣爱好，属性关系等，预测如（Alice, interested in，?）这样的喜好问题答案。由此，表示学习，即将知识图谱中的信息向量化表示进而与机器学习技术相结合，是前沿研究的重点问题。

但是，由于知识图谱中语义和图的连接关系都非常复杂，传统方法依赖手动设计模型架构很难充分捕捉图谱中有效信息。受自动化机器学习^[1,2]（AutoML）相关技术启发，我们让“知识自己说话”，利用图谱自身的性质自动设计合适的表示学习模型。

主要内容

知识图谱中基本单元为（头实体、关系、尾实体）这样的三元组，对于不同知识图谱学习任务及数据，其核心研究问题为如何构建评分函数^[^3]（scoring function）来衡量三元组的可编程性。打分函数建模是理解知识图谱中复杂语义信息、挖掘潜在关系的关键。由于不同知识图谱的语义信息差异很大，如社交图谱和医药图谱，AutoBLM采用自动化机器学习技术来自动地设计评分函数。

如图2所示，通常来说知识图谱领域的评分函数是人为定义设计的，这需要很强的专家知识，对任务、数据有着独到的理解。自动化的解决方案，算法根据模型效果的反馈，来自主设计评分函数，通过不断循环迭代来优化评分函数，实现在特定任务数据上低门槛，高性能的评分函数设计。

图表2 自动化解决方案示意图

语义驱动的搜索空间

AutoBLM首先对评分函数建立了统一的表达形式及语义驱动的搜索空间。在现有的打分函数中，双线性模型（BiLinear Model, BLM）是一类比较好的模型，其表达能力强、复杂度低、建模效果好。图3展示了两个不同的双线性模型的表达式，以及他们的抽象矩阵表达，DistMult^[^4]和SimplE^[5]不同的矩阵结构，决定了他们能否对各类关系进行建模。常见的关系类型包括对称性（如朋友关系），反对称性（如长辈关系），斜对称性（如属性关系），和逆向关系（如长辈和晚辈）。

图表3 双线性（BiLinear Model）打分函数示例

为了适应不同知识图谱中的不同语义模式，AutoBLM基于双线性模型，构建了统一的搜索空间，如图4所示，

是一个跟关系嵌入

裁剪空间的搜索算法

考虑到搜索空间非常巨大且训练和评估每一个结构都需要非常多时间，如何快速有效地搜索更好的结构，是搜索算法所需要关心的问题。AutoBLM在搜索算法的设计上，充分考虑了搜索空间的性质，在给定结构的基础上，对结构先进行一定程度的筛选，再进行模型评估，从而节省开销。如图5所示，AutoBLM利用Filter过滤掉一些非满秩、等价的结构进行初筛，再利用Predictor对结构的对称性特征进行评估，进一步筛选出可能较好地几个结构，对搜索空间进行大幅度的裁剪。在外层，AutoBLM利用渐进式搜索方式，AutoBLM+利用演化的搜索方式，不断迭代、优化，得到更好的结构。

图表5 搜索算法示意图

实验结果

AutoBLM在知识图谱学习代表性任务链接预测上进行了实验，均超过了手工设计模型的效果。此外，AutoBLM还在大型生物知识图谱ogbl-biokg和维基百科图谱ogbl-wikikg2上表现优异，OGB^[6]是目前公认的图学习基准数据集代表，由斯坦福大学Jure Leskovec教授团队建立，于2020年国际顶级学术会议NeurIPS上正式开源。以质量高、规模大、场景复杂、难度高著称，素有知识图谱领域“ImageNet”之称，AutoBLM曾在2021年4月分别拿到第一名成绩，刷新榜单记录（见下图AutoSF）。

图表6 AutoBLM在OGB上的实验效果

未来工作

AutoBLM(+)的工作重在对知识的理解，对语义的建模。作为一种特殊的图结构，设计合适的图神经网络，捕获知识图谱中结构及复杂语义，同时可以利用自动化的方式，对不同知识图谱任务上语义结构信息的平衡。以上工作解决了知识图谱学习中的建模问题，而调参问题在知识图谱实际应用中同样重要，如何高效地搜索性能良好的超参数是一个研究重点。将AutoBLM(+)拓展到更多元的应用场景，如事件图谱、医药图谱等等，也是潜在研究方向。

欢迎大家关注本组更多工作：https://github.com/orgs/AutoML-Research/

参考文献

[1] F Hutter, L. Kotthoff, and J. Vanschoren. Automated machine learning: methods, systems, challenges. Springer. 2019

[2] Q. Yao and M. Wang, “Taking human out of learning applications: A survey on automated machine learning,” arXiv: 1810.13306, Tech. Rep., 2018.

[3] Z. Wang, J. Zhang, J. Feng, and Z. Chen, “Knowledge graph embedding by translating on hyperplanes,” in AAAI, vol. 14, 2014, pp. 1112–1119.

[4] B. Yang, W. Yih, X. He, J. Gao, and L. Deng, “Embedding entities and relations for learning and inference in knowledge bases,” in ICLR, 2015.

[5] M. Kazemi and D. Poole, “SimplE embedding for link prediction in knowledge graphs,” in NeurIPS, 2018.

[6] Open Graph Benchmark:https://ogb.stanford.edu/

参考链接：

https://www.ee.tsinghua.edu.cn/info/1076/3716.htm

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ATSF” 就可以获取《AutoML如何用于KG？清华等TPAMI2022《知识图谱学习的双线性评分函数搜索》自动设计图谱评分函数学习复杂KG语义》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资料

登录查看更多

相关内容

知识图谱学习

关注 3

【TPAMI2022-清华】OANet：基于层次结构的图神经网络来学习两视图几何匹配关系建立

专知会员服务

28+阅读 · 2022年5月30日

【清华第四范式港科大TPAMI2022】知识图谱学习的双线性评分函数搜索

专知会员服务

15+阅读 · 2022年4月25日

知识图谱可解释推理研究综述

专知会员服务

177+阅读 · 2021年12月31日

【AAAI2022】利用化学元素知识图谱进行分子对比学习

专知会员服务

28+阅读 · 2021年12月3日

【IJCAI2021】基于图学习的推荐系统综述

专知会员服务

97+阅读 · 2021年5月7日

【KDD2020】增量移动用户分析：用于事件流建模的空间知识图谱强化学习方法

专知会员服务

20+阅读 · 2020年11月18日

【ACL2020】基于图神经网络的文本分类新方法

专知会员服务

69+阅读 · 2020年7月12日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

KGCN：使用TensorFlow进行知识图谱的机器学习

专知会员服务

83+阅读 · 2020年1月13日

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

专知会员服务

136+阅读 · 2019年11月7日

知识图谱可解释推理研究综述

专知

3+阅读 · 2021年12月31日

基于图神经网络的知识图谱研究进展

AI科技评论

20+阅读 · 2020年8月31日

一文读懂图卷积GCN

计算机视觉life

21+阅读 · 2019年12月21日

NAACL 2019开源论文：基于胶囊网络的知识图谱完善和个性化搜索

PaperWeekly

18+阅读 · 2019年10月28日

KGCN：使用TensorFlow进行知识图谱的机器学习

专知

16+阅读 · 2019年8月4日

干货 | 从零到一学习知识图谱的技术与应用

AI100

12+阅读 · 2018年7月29日

如何从零开始搭建知识图谱？

AI前线

23+阅读 · 2018年7月2日

领域应用 | 知识图谱的技术与应用

开放知识图谱

17+阅读 · 2018年6月14日

关于知识图谱，各路大神最近都在读哪些论文？

PaperWeekly

12+阅读 · 2018年5月23日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

复杂网络链接预测与社团发现混合方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于概率图的判别式关系隐层空间模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

因果学习和推理的认知神经机制和心理病理学研究

国家自然科学基金

4+阅读 · 2013年12月31日

多义性对象学习建模中若干问题的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于机器学习的蛋白质相互作用与功能预测方法研究

国家自然科学基金

2+阅读 · 2011年12月31日

约化群酉表示的branching law及其应用

国家自然科学基金

0+阅读 · 2009年12月31日

Ultra-marginal Feature Importance

Arxiv

0+阅读 · 2022年6月13日

Curvilinearity and Orthogonality

Arxiv

0+阅读 · 2022年6月12日

Variational Physics Informed Neural Networks: the role of quadratures and test functions

Arxiv

0+阅读 · 2022年6月9日

Graph Enhanced Representation Learning for News Recommendation

Arxiv

24+阅读 · 2020年3月31日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Memory Augmented Graph Neural Networks for Sequential Recommendation

Arxiv

13+阅读 · 2019年12月26日

Few-Shot Knowledge Graph Completion

Arxiv

14+阅读 · 2019年11月26日

Knowledge Graph Alignment Network with Gated Multi-hop Neighborhood Aggregation

Arxiv

19+阅读 · 2019年11月20日

Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

Arxiv

25+阅读 · 2019年5月21日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

VIP会员