在一个持续的循环,在这个循环中,对对抗攻击更强的防御随后被更高级的防御感知攻击打破。我们提出了一种结束此循环的新方法,即通过使攻击者生成语义上类似于攻击目标类的输入来“转移”对抗攻击。为此,我们首先提出一种基于胶囊网络的更强大的防御,它结合了三种检测机制来实现对标准攻击和防御感知攻击的最新检测性能。然后,我们进行了一项人体研究,要求参与者对攻击产生的图像进行标记,结果表明,针对我们的防御系统的未检测到的攻击通常与对抗目标类相似。这些攻击图像不能再被称为“对抗性的”,因为我们的网络像人类一样对它们进行分类。
地址:
https://arxiv.org/abs/2002.07405
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DAA” 就可以获取《偏转对抗攻击 Deflecting Adversarial Attack》专知下载链接