作者:Jintang Li, Tao Xie, Liang Chen, Fenfang Xie, Xiangnan He, Zibin Zheng
单位:中山大学&中国科学技术大学
论文链接:https://arxiv.org/abs/2009.03488
代码链接:https://github.com/EdisonLeeeee/SGAttack
DeepRobust代码链接:https://github.com/DSE-MSU/DeepRobust
今天分享的是中大图学习团队在图对抗攻防领域的一篇文章:Adversarial Attack on Large Scale Graph,已被TKDE期刊收录。
最近的一些研究表明,图神经网络模型在面对恶意攻击时往往显得很脆弱,从而很容易被误导。虽然现有的一些攻击方法如利用梯度信息等的策略拥有比较优异的攻击效果,但是这些方法具有较大的时间和空间复杂度,所以并不能被利用到较大规模的图数据集上。作者认为这主要是因为这些方法往往需要利用完整的图来进行训练,导致时空复杂度会随着数据的规模而不断增大。基于此,作者提出了Simplified Gradient-based Attack (SGA) 攻击策略。SGA只需要考虑基于目标节点的 阶子图来进行梯度的计算,从而极大地降低了在大数据集上时间和空间的消耗。此外,针对攻击隐蔽性问题,作者基于同度性(Assortativity)指标,提出了Degree Assortativity Change (DAC) 来衡量不同攻击的隐蔽性。
在图攻击领域中存在着两个挑战。
本文考虑基于图结构的投毒目标攻击(Poisoning targeted attack),即关注训练阶段且针对特定节点的攻击,攻击方式仅限于修改图结构(不包括对节点特征的攻击)。
本文的主要贡献主要有两部分:(1)快速有效的图攻击框架SGA;(2)攻击隐蔽性的度量指标DAC。
SGA框架基于以往采用替代模型进行攻击的思路,主要有以下几个步骤:
其中 Nettack是采用稀疏矩阵存储,然后根据贪心算法迭代计算每条边修改的影响来进行攻击,虽然空间复杂度在大图上可以接受,但是时间复杂度过高;GradArgmax则是传统的基于梯度的算法,将图存储为密集邻接矩阵计算每条边的梯度,不仅空间复杂度高并且时间复杂度也不低。本文提出的SGA攻击算法,由于仅需要目标结点的 阶子图进行计算,因此兼具时间和空间复杂度上的高效。
本篇文章的另一个贡献是提出攻击隐蔽性度量指标同度性变化(Degree Assortativity Change, DAC)。
同度性系数degree assortativity coefficient:即不同度数的节点之间相互连的倾向,如果同度性系数比较高,则代表高度节点倾向于与高度节点相连,反之则倾向于与低度节点相连。同度性系数基于皮尔森系数定义,描述了一个网络中各个节点的连接倾向程度。
作者基于同度性系数定义了DAC指标,具体为:
其中 为原图的同度性系数, 为攻击目标节点后生成的扰动图的同度性系数。当攻击隐蔽性越高,攻击前后网络的DAC指标变化的越小。
除了传统的几个引文网络数据集外,考虑了23w+节点的Reddit数据集
首先作者比较了攻击效率,包括运行时间和空间消耗,所提方法具有运行时间段、运行内存消耗少、攻击隐蔽性强等有点。
接着是比较攻击效果,所提方法在各个数据集上均取得了较好的表现,并且能够扩展至大数据集场景:
本文针对图对抗攻防场景,提出了一种基于 阶子图的攻击方法,能够快速有效地对图神经网络进行攻击;此外,作者还提出了一种衡量攻击影响程度的度量指标,可用于对攻击隐蔽性进行评价。