Although Deep Neural Networks (DNNs) achieve excellent performance on many real-world tasks, they are highly vulnerable to adversarial attacks. A leading defense against such attacks is adversarial training, a technique in which a DNN is trained to be robust to adversarial attacks by introducing adversarial noise to its input. This procedure is effective but must be done during the training phase. In this work, we propose a new simple and easy-to-use technique, KATANA, for robustifying an existing pretrained DNN without modifying its weights. For every image, we generate N randomized Test Time Augmentations (TTAs) by applying diverse color, blur, noise, and geometric transforms. Next, we utilize the DNN's logits output to train a simple random forest classifier to predict the real class label. Our strategy achieves state-of-the-art adversarial robustness on diverse attacks with minimal compromise on the natural images' classification. We test KATANA also against two adaptive white-box attacks and it shows excellent results when combined with adversarial training. Code is available in https://github.com/giladcohen/KATANA.


翻译:虽然深神经网络(DNNS)在许多现实世界任务上取得了卓越的成绩,但它们极易受到对抗性攻击的伤害。 对抗性训练是对这种攻击的主要防御手段,即对抗性训练,在这种训练中,DNN通过输入对抗性噪音来训练对对抗性攻击的强大。这个程序是有效的,但在培训阶段必须完成。在这项工作中,我们提出一种新的简单而容易使用的技术,即KATANA, 以在不改变其重量的情况下巩固现有的预先训练过的DNNN, 对于每一个图像来说,我们通过应用不同颜色、模糊、噪音和几何学变来产生随机测试时间增强(TTAs)。接下来,我们利用DNN的日志输出来训练一个简单的随机森林分类器来预测真正的阶级标签。我们的战略在各种攻击上达到最先进的对抗性强的状态,在自然图像分类上达成最小的妥协。我们测试KATANANA,还针对两种适应性白箱攻击,并且当与对抗性训练相结合时显示优异的结果。 守则可在 https://github.com/giladadad/ATAN。

0
下载
关闭预览

相关内容

专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
45+阅读 · 2020年10月31日
Python图像处理,366页pdf,Image Operators Image Processing in Python
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
49+阅读 · 2020年7月4日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
已删除
架构文摘
3+阅读 · 2019年4月17日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年11月9日
Arxiv
4+阅读 · 2019年11月21日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
Arxiv
4+阅读 · 2017年12月25日
VIP会员
相关VIP内容
相关资讯
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
已删除
架构文摘
3+阅读 · 2019年4月17日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员