The vulnerability of deep neural networks (DNNs) to adversarial examples has attracted more attention. Many algorithms have been proposed to craft powerful adversarial examples. However, most of these algorithms modified the global or local region of pixels without taking network explanations into account. Hence, the perturbations are redundant, which are easily detected by human eyes. In this paper, we propose a novel method to generate local region perturbations. The main idea is to find a contributing feature region (CFR) of an image by simulating the human attention mechanism and then add perturbations to CFR. Furthermore, a soft mask matrix is designed on the basis of an activation map to finely represent the contributions of each pixel in CFR. With this soft mask, we develop a new loss function with inverse temperature to search for optimal perturbations in CFR. Due to the network explanations, the perturbations added to CFR are more effective than those added to other regions. Extensive experiments conducted on CIFAR-10 and ILSVRC2012 demonstrate the effectiveness of the proposed method, including attack success rate, imperceptibility, and transferability.


翻译:深神经网络(DNNS)对对抗性实例的脆弱性引起了更多的注意,许多算法都建议设计强大的对抗性实例,但是,大多数这些算法在不考虑网络解释的情况下改变了全球或当地象素区域,因此,扰动是多余的,很容易被人类眼睛发现。在本文中,我们提出了一种产生局部扰动的新方法。主要想法是通过模拟人类注意力机制,然后给CFR增添扰动,找到一个图像的成因特征区域。此外,在激活地图的基础上设计了一个软面罩矩阵,以精确地代表CFR中每个象素的贡献。我们用这种软面罩开发了新的损失功能,温度为寻找CFR的最佳扰动进行反向的搜索。由于网络解释,CFR增加的扰动比其他地区增加的更有效。在CIFAR-10和ILSVRC-2012上进行的广泛实验,展示了拟议方法的有效性,包括攻击成功率、不可视力和可转移性。

0
下载
关闭预览

相关内容

Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
18+阅读 · 2021年4月4日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
专知会员服务
60+阅读 · 2020年3月19日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
一场深度学习引发的图像压缩革命
极市平台
8+阅读 · 2018年3月30日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
12+阅读 · 2020年12月10日
Adversarial Metric Attack for Person Re-identification
VIP会员
相关VIP内容
Google-EfficientNet v2来了!更快,更小,更强!
专知会员服务
18+阅读 · 2021年4月4日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
专知会员服务
60+阅读 · 2020年3月19日
相关资讯
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
一场深度学习引发的图像压缩革命
极市平台
8+阅读 · 2018年3月30日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员