图灵奖得主Bengio提出并开源图马尔科夫神经网络

会员服务 ·

图灵奖得主Bengio提出并开源图马尔科夫神经网络 | ICML2019

2019 年 9 月 13 日 新智元

新智元推荐

来源：机器学习blog（ID：mlanddlanddm）

【新智元导读】本文主要研究关系数据中的半监督对象分类，该问题在关系数据建模中是比较基本的问题。在基于统计的关系学习（如关系马尔科夫网络）和图神经网络（如图卷积网络）的相关文献中，对该问题进行了广泛的研究。

基于统计的关系学习方法，利用条件随机场能够学习对象标签之间的依赖性，然后进行集体分类，而图神经网络能够进行端到端的训练。这篇文章提出了图马尔科夫神经网络（GMNN），该网络能够结合二者的优势。

题目：GMNN: Graph Markov Neural Networks

作者：Meng Qu，Yoshua Bengio，Jian Tang

Montreal Institute for Learning Algorithms (MILA), University of Montreal, Canadian Institute for Advanced Research (CIFAR), HEC Montreal

论文地址：http://proceedings.mlr.press/v97/qu19a/qu19a.pdf

GMNN用条件随机场对对象标签的联合分布进行建模，其中条件随机场能够利用变分EM（期望最大）算法进行有效训练。

在E -Step中，图神经网络能够学到有效的对象表示，该表示能够近似对象标签的后验分布。在M -Step中，另一个图神经网络用于对局部标签依赖进行建模。

在对象分类、链路分类和无监督节点表示学习上的实验表明，GMNN 取得了最好的结果。

基于条件随机场的方法有一些不足，比如

（1）这些方法通常将条件随机字段中的势函数定义为某些人工设计的特征函数的线性组合，这些函数是启发式的。而且，这种模型的表达能力比较有限。

（2）由于对象之间的关系结构比较复杂，对未标记对象的标签的后验分布进行推断仍然具有一定的挑战性。

基于图的神经网络也有一些不足，一个关键的限制即为对象的标签是根据其表示形式独立预测的，如此一来，对象标签之间的联合依赖项会被忽略。

在变分EM框架中，E-step用于推理，M-step用于学习。在学习过程中，GMNN的训练过程不是最大化似然函数，而是优化伪似然函数，并利用图神经网络对对象标签的局部条件分布进行建模。这种图神经网络能够比较好地学习对象标签的依赖性，并且不需要人工设计势函数。

在推理过程中，由于精确推理比较难解，可以利用均值场近似值来解决。

受摊销推理的启发，作者们利用另一个图神经网络对对象标签的后验分布进行建模，进而可以学习有用的对象表示用于预测对象的标签。在推理过程中，利用图神经网络，可以显著减少参数的数量，并且在推理中的不同对象之间可以共享统计证据。

半监督对象分类的问题描述如下

简言之即为，已知部分标签推测未知的标签。

在统计关系学习中，问题描述如下

在图神经网络中，问题描述如下

由于很多对象的标签是未知的，因此可以将最大化对数似然函数转化为求其证据下界（ELBO），此时求解可以交替执行变分E-Step和M-Step。

为了避免计算配分函数，可以优化下面的伪似然函数，该似然函数基于样本点的邻域样本集。

在推理过程中，由于标签之间的复杂依赖关系，直接推理后验分布比较难，因此可以基于平均场方法来解决。

对于未知标签的对象，利用采样来得到，而对于已知标签的对象，直接利用其真实标签。实际情况中利用一个采样即可。

在学习过程中只需要学习条件分布，不需要人工特征。

为了对不同对象之间的长程依赖进行建模，可以利用多信息传输层。

优化算法伪代码如下

整体框架图示如下

在实验中，针对对象分类任务，每个类中有20个有标签的样本，度量标准为准确率。

数据集信息统计如下

对象分类中几种算法的效果对比如下

无监督节点表示学习中几种算法效果对比如下

在对象分类问题中，参数设置如下

无监督节点表示学习中参数设置如下

链接分类中参数设置如下

链接分类问题中几种方法的效果对比如下

不同结构下摊销推理的结果对比如下

收敛性分析图示如下，容易看出收敛速度很快

代码地址

https://github.com/DeepGraphLearning/GMNN

本文经授权转载自“ 机器学习blog” 原创： FrankLearningMachine

登录查看更多

相关内容

对象分类

关注 1

【经典】GAT作者Petar剑桥大学博士论文《深层神经网络结构的复兴》147页pdf

专知会员服务

64+阅读 · 2020年5月27日

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【Yoshua Bengio新论文】多任务自监督学习语音识别，MULTI-TASK SELF-SUPERVISED LEARNING FOR ROBUST SPEECH RECOGNITION

专知会员服务

39+阅读 · 2020年1月30日

必读的7篇 IJCAI 2019【图神经网络（GNN）】相关论文

专知会员服务

92+阅读 · 2020年1月10日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【Yoshua Bengio-先验意识论文最新版本】The Consciousness Prior，Yoshua Bengio

专知会员服务

19+阅读 · 2019年12月12日

【报告推荐 | HEC-Montreal唐建博士】图神经网络推理，附27页ppt

专知会员服务

78+阅读 · 2019年11月13日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知会员服务

86+阅读 · 2019年10月11日

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

专知会员服务

55+阅读 · 2019年9月26日

论文浅尝 | GMNN: Graph Markov Neural Networks

开放知识图谱

20+阅读 · 2020年2月14日

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

学术头条

15+阅读 · 2019年12月25日

【HEC-Montreal唐建博士】图神经网络推理，附27页ppt

专知

47+阅读 · 2019年10月30日

专知

67+阅读 · 2019年9月26日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

ICLR 2019 | 与胶囊网络异曲同工：Bengio等提出四元数循环神经网络

机器之心

3+阅读 · 2019年2月9日

实验室论文被DASFAA-19录用

inpluslab

9+阅读 · 2019年1月17日

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

【CNN已老，GNN来了】DeepMind、谷歌大脑、MIT等27位作者重磅论文，图网络让深度学习也能因果推理

新智元

6+阅读 · 2018年6月14日

Causality for Machine Learning

Arxiv

25+阅读 · 2019年11月24日

HyperGCN: A New Method of Training Graph Convolutional Networks on Hypergraphs

Arxiv

13+阅读 · 2019年5月22日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

Neural Arithmetic Logic Units

Arxiv

5+阅读 · 2018年8月1日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Unsupervised Cross-dataset Person Re-identification by Transfer Learning of Spatial-Temporal Patterns

Arxiv

6+阅读 · 2018年3月20日

Towards a Continuous Knowledge Learning Engine for Chatbots

Arxiv

6+阅读 · 2018年2月24日

No Blind Spots: Full-Surround Multi-Object Tracking for Autonomous Vehicles using Cameras & LiDARs

Arxiv

6+阅读 · 2018年2月23日

Towards an Engine for Lifelong Interactive Knowledge Learning in Human-Machine Conversations

Arxiv

5+阅读 · 2018年2月16日

VIP会员