近期必读的6篇AI顶会WWW 2020【图神经网络（GNN）】相关论文- 专知

近期必读的6篇AI顶会WWW 2020【图神经网络（GNN）】相关论文

【导读】国际万维网大会（The Web Conference，简称WWW会议）是由国际万维网会议委员会发起主办的国际顶级学术会议，创办于1994年，每年举办一届，是CCF-A类会议。WWW 2020将于2020年4月20日至4月24日在中国台湾台北举行。本届会议共收到了1129篇长文投稿，录用217篇长文，录用率为19.2%。近期，随着会议的临近，有很多paper放出来，专知小编提前整理了WWW 2020图神经网络(GNN)比较有意思的的论文—TaxoExpan，结构深度聚类网络、MetapathGNN、对抗样本、图域自适应。

AAAI2020 、 ACMMM2019GNN、 CIKM2019GNN 、 ICLR2020GNN 、EMNLP2019GNN、 ICCV2019GNN_Part2 、 ICCV2019GNN_Part1 、 NIPS2019GNN 、 IJCAI2019GNN_Part1 、 IJCAI2019GNN_Part2 、 KDD2019GNN 、 ACL2019GNN 、 CVPR2019GNN 、ICML2019GNN

1. TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced Graph Neural Network

作者：Jiaming Shen, Zhihong Shen, Chenyan Xiong, Chi Wang, Kuansan Wang, Jiawei Han

摘要：本体结构（Taxonomies）由机器可解释的语义组成，并为许多Web应用程序提供有价值的知识。例如，在线零售商(亚马逊和eBay)使用本体结构进行产品推荐，而网络搜索引擎(Google和Bing)利用本体结构来增强查询理解。当前我们在人工或半自动地构建本体结构方面已经做出了巨大的努力。然而，随着网络内容数量的快速增长，现有的本体结构无法捕捉到新兴的知识。因此，在许多应用程序中，十分需要对现有本体结构进行动态扩展。在本文中，我们研究了如何通过添加一组新的概念来扩展现有的本体结构。我们提出了一种新的自监督框架TaxoExpanTM，该框架从已有的本体结构中自动生成一组 ⟨query concept, anchor concept ⟩ 对作为训练数据。使用这样的自监督数据，TaxoExpanTM学习一个模型来预测query concept是否是 anchor concept的直接下义词。我们在TaxoExspan中提出了两种创新技术：(1)位置增强型图形神经网络，它编码现有本体结构中anchor concept的局部结构；2）噪声鲁棒性训练目标，使学习的模型能够对自监控数据中的标签噪声不敏感。在来自不同领域的三个大规模数据集上的广泛实验证明了TaxoExspan在分类系统扩展方面的有效性和高效性。

网址：https://arxiv.org/abs/2001.09522

2. Structural Deep Clustering Network

作者：Deyu Bo, Xiao Wang, Chuan Shi, Meiqi Zhu, Emiao Lu, Peng Cui

摘要：聚类是数据分析的基本任务。近年来，深度聚类技术(deep clustering)得到了广泛的关注，它的灵感主要来自于深度学习方法。当前的深度聚类方法通常借助深度学习强大的表示能力(如自编码)来提高聚类结果，这表明学习一种有效的聚类表示是一个关键的要求。深度聚类方法的优势在于从数据本身中提取有用的表示，而不是从数据的结构中提取，这在表示学习中受到的关注较少。基于图卷积网络(GCN)在对图结构进行编码方面取得的巨大成功，我们提出了一种结构化深度聚类网络(SDCN)，将结构信息集成到深度聚类中。具体来说，我们设计了一个传递算子，将自编码器学习到的表示转换到相应的GCN层，并设计了双重自监督机制来统一这两种不同的深层神经结构，指导整个模型的更新。通过这种方式，从低阶到高阶的多种数据结构自然地与自动编码器学习的多种表示相结合。在此基础上，从理论上分析了传递算子。通过使用传递操作符，GCN改进了作为高阶图正则化约束的特定于自编码的表示形式，并且自动编码器有助于缓解GCN中的过度平滑问题。通过综合实验，我们证明我们提出的模型可以持续地比最先进的技术表现得更好。

网址：

https://arxiv.org/abs/2002.01633

3. MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

作者：Xinyu Fu, Jiani Zhang, Ziqiao Meng, Irwin King

摘要：大量真实世界的图或网络本质上是异构的，涉及节点类型和关系类型的多样性。异构图嵌入是将异构图的丰富结构和语义信息嵌入到低维节点表示中。现有的模型通常定义多个metapaths在异构图捕捉复合关系和指导邻居选择。但是，这些模型要么忽略节点内容特性，要么沿着元路径丢弃中间节点，要么只考虑一个元路径。为了解决这三个局限性，我们提出了一种新的集合图神经网络模型来提高最终性能。具体来说，MAGNN使用了三个主要组件，即，节点内容转换封装输入节点属性，元内聚合合并中间语义节点，元间聚合合并来自多个元的消息。在三个真实世界的异构图数据集上进行了大量的节点分类、节点聚类和链路预测实验，结果表明MAGNN的预测结果比最先进的基线更准确。

网址：

https://www.zhuanzhi.ai/paper/d763a3d94aebcffc20f2a4e13b7b5465

https://arxiv.org/abs/2002.01680

4. Certified Robustness of Community Detection against Adversarial Structural Perturbation via Randomized Smoothing

作者：Jinyuan Jia, Binghui Wang, Xiaoyu Cao, Neil Zhenqiang Gong

摘要：社区发现（Community detection）在理解图结构中起着关键作用。但是，最近的一些研究表明，社区发现很容易受到对抗性结构的干扰。即通过在图中添加或删除少量选择的边，攻击者可以控制发现的社区。然而，目前还没有关于社区发现对这种对抗性结构扰动的鲁棒性的研究。为了减少这一差距，在这项工作中，我们开发了第一个经过认证的可以抵御对抗性结构扰动的社区发现的鲁棒性保证。在任意给定的社区发现方法的基础上，通过对图结构随机进行扰动，构建了一种新的平滑社区发现方法。在理论上，当攻击者添加/删除有限数量的边时，平滑社区发现方法可以将给定的任意节点集合分到相同的社区(或不同的社区)中。此外，我们还根据经验在真实社区的多个现实图上评估了我们的方法。

网址：

https://arxiv.org/abs/2002.03421

5. Unsupervised Domain Adaptive Graph Convolutional Networks

作者：Man Wu, Shirui Pan, Chuan Zhou, Xiaojun Chang, Xingquan Zhu

摘要：图卷积网络(GCNS)在许多与图相关的分析任务中取得了成功。然而，由于图表示学习和图结构上的域自适应方面的挑战，大多数GCN只工作在单个域(图)中，不能将知识从一个域(图)传递到其他域(图)中。本文提出了一种新的图域自适应学习方法--无监督域自适应图卷积网络(UDAGCN)。为了实现有效的图表示学习，我们首先提出了一个对偶图卷积网络组件，该组件联合利用局部一致性和全局一致性来进行特征聚合。注意力机制还用于为不同图中的每个节点产生统一表示。为了便于图之间的知识传递，我们提出了一个域自适应学习模块，将源分类器损失、域分类器损失和目标分类器损失这三个不同的损失函数作为一个整体进行优化，从而可以区分源域中的类别标签、不同领域样本和目标领域的类别标签。我们还在节点分类任务的真实数据集上的实验结果验证该方法的性能，并与最新的图神经网络算法进行了比较。

网址：

https://www.researchgate.net/publication/338844424_Unsupervised_Domain_Adaptive_Graph_Convolutional_Networks

6. A Kernel of Truth: Determining Rumor Veracity on Twitter by Diffusion Pattern Alone

作者：Nir Rosenfeld, Aron Szanto, David C. Parkes

摘要：最近，在错误信息检测领域已经使用文本中丰富的信号以及与社交媒体上的内容相关的用户身份来进行检测。但由于文本可以被策略性地操纵，账户也可以用不同的名字重新创建，以上这些方法本质上是脆弱的。在这项工作中，我们研究了另一种更加自然与健壮的模式：信息传播的模式。仅根据未经证实的谣言在社交网络中的传播模式，就能辨别在线传播的未经证实的谣言的真实性吗？

使用图核（graph kernels ）从Twitter中提取复杂的拓扑信息，我们训练了不考虑语言，用户身份和时间的准确预测模型，这首次证明了这种“sanitized”的扩散模式具有很高的准确性。我们的结果表明，通过适当的聚集，即使在传播的早期阶段，人群的集中共享模式也可能会显示出辨别谣言真假的强有力的信号。