麻省理工Hadi Salman新作：ViT架构可以有效抵御图像补丁攻击

会员服务 ·

麻省理工Hadi Salman新作：ViT架构可以有效抵御图像补丁攻击

2021 年 11 月 3 日 PaperWeekly

©PaperWeekly 原创 · 作者 | 张一帆

学校 | 中科院自动化所博士生

研究方向 | 计算机视觉

本文是 MIT 大牛 Hadi Salman 于 10 月 11 放在 arXiv 的文章。

论文标题：

Certified Patch Robustness via Smoothed Vision Transformers

论文链接：

https://arxiv.org/pdf/2110.07719.pdf

代码链接：

https://github.com/MadryLab/smoothed-vit

首先介绍一下本文的背景知识。

Preliminaries

1.1 Patch Robustness

Patch Robustness 是目前被广泛研究的一种鲁棒性范式，即使用一小块图像 patch 对图像进行攻击，研究人员使用对抗补丁欺骗图像分类器，操纵物体探测器以及还可以中断光流估计。

1.2 Derandomized smoothing

目前最流行的方法即 Derandomized smoothing，这种方法维护一堆被宽度为的 patch 攻击的 ablations ，对于一个的图像，为了更好的说明这个问题，这里使用列补丁为例，对一个宽度为的列补丁，它可以从图像的任意位置开始，因此。

Derandomized smoothing 的方法维护一个 smoothed classifier ，由两部分组成，一个传统的基本分类器和一个 ablations 集合，它通过如下模式进行分类：

这里的表示将中被分类为的样本总数。

被平滑分类器分类成功的准确率被称为标准准确度。

这里又引入一个概念 certifiably robust：如果正确分类的数目超过第二个类非常多，那么这个分类器显然更难被外界的 patch 所干扰，此时称之为 certifiably robust。准确来说，令表示 ablation set 中一个对抗补丁最多可以同时相交的对抗补丁的数目，对于宽度为的列补丁来说，的 patch 最多可以和，此时一个分类器被称为 certifiably robust 当且仅当：

如果达到了这个阈值，那么最频繁的类将被保证不会改变，即使对抗补丁破坏了它所相交的每一个 ablation。平滑分类器依然做出的既正确又可靠的预测。

虽然 certifiably robust 像许多其他认证防御一样可以提供对抗攻击的保证，但它们面临几个限制其实用性的主要挑战：

1. 只对相对较小的对抗补丁适用。

2. 存在 tradeoff，鲁棒性的增强以准确性的降低为代价。一个标准的 ResNet-50 在 ImageNet 基准上可以达到 76% 的准确率，并且在一个典型的 GPU 上花费不到 1 秒的时间进行预测。相反，表现最好的认证防御模型，如标准准确率为 44%，在类似的硬件上进行预测需要 150 秒。

3. 推理时间往往比标准的、非健壮的模型大几个数量级，这使得经过认证的防御很难在实时设置中部署。

1.3 Vision transformers

ViT 区别于传统 CNN 网络主要在 2 个方面：

1. Tokenization：ViT 使用 patch 的方式对图像特征进行组织，将整个图像分成个 patch，每个 patch 被转化为 embedding + 一个位置编码。

2. Self-Attention：大名鼎鼎的 multi-headed self-attention layers。

1.4 Smoothed vision transformers

ViT 之所以适合本任务主要有两个原因：

1. ViT 将图像作为 token 集合处理。因此，ViT 具有简单地从输入中删除不必要的 token 并忽略图像的更大区域的自然能力，这可以大大加快 ablations 的处理速度。

2. CNN 要得到全局的感受野需要一层层的传播到后面的层才能拿到全局信息，但是 self-attention 在每一层都共享全局信息。因此 ViT 更有希望去处理小的，没有被 mask 的区域。

本文首先显示了 ViT 可以大幅度提升鲁棒性，同时分类准确度不会减少。然后本文对 ViT 的结构进行了一定的改进，大幅度提高了 smoothing procedure 的预测速度。改进也很 intuitive，就是将 ablation 中完全 mask 的 token 全部删掉，留下的 token 就不会很多，预测速度大幅提升。

Faster inference with ViTs

Derandomized smoothing 往往是非常昂贵的操作，特别是对于比较大的图像。一个的图像，有个列 ablation，因此比起传统模型，前向传递所用时间是传统模型的倍。为了解决这个问题，本文首先修改 ViT 架构，以避免在 mask 像素上进行不必要的计算。然后演示了通过大步减少 ablation 的数量可以提供进一步的加速。这两个互补的修改极大地提高了平滑分类器的推断时间，使它们在速度上与标准（非鲁棒的）卷积架构相当。

2.1 Dropping masked tokens

这一部分主要分为三步：

1. 将整个图像编码为一组 token 和相应的位置编码。

2. 丢弃完全被 mask 的 token。

3. 将剩余的 token 作为输入。

因为位置编码保留了剩余 token 的空间信息，丢弃完全被 mask 的 token 后在 ablation 上的分类准确度不会受到影响。

2.2 Strided ablations

另一个问题就是平滑分类器大量的 ablations，这对实时性的设备而言也不可取。本文提出了 Strided ablations，相比于之前工作在每个位置都取一个 ablation，本文给一个步长，每隔采样出一个 ablation，实验证明这种方式不会严重损害标准准确率和验证准确率。

一张表总结本文的主要结果，在 imagenet 上， pixel 表示有这么多的像素作为对抗补丁。可以看到 ViT 本身作为 pipeline 就已经比 resnet50 好很多了。加上本文的改进之后，在最大的模型 ViT-B 上以步长的实验设置下，预测时间减小了两个数量级，鲁棒性还有所提升。

特别鸣谢

感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：hr@paperweekly.site

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

登录查看更多

相关内容

稳健性

关注 3

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

专知会员服务

84+阅读 · 2022年4月9日

【AAAI2022】自适应的随机平滑防御的鲁棒性认证方法

专知会员服务

26+阅读 · 2021年12月27日

NeurIPS 2021 | 寻MixTraining: 一种全新的物体检测训练范式

专知会员服务

12+阅读 · 2021年12月9日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

【ICML2021】分布式对抗训练中的基本权衡

专知会员服务

17+阅读 · 2021年8月6日

【ICML2021】轻量级结构多样化的网络结构

专知会员服务

28+阅读 · 2021年8月2日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

【ICML2021】具有性能保证的弱监督下的对抗性多类学习

专知会员服务

17+阅读 · 2021年7月13日

图神经网络的对抗标签翻转攻击与防御

专知会员服务

20+阅读 · 2021年3月28日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

53+阅读 · 2020年1月24日

2040张图片训练出的ViT，准确率96.7%，连迁移性能都令人惊讶 | 南京大学

量子位

0+阅读 · 2022年2月2日

AAAI 2022 | 基于强化学习的视频弹幕攻击

PaperWeekly

1+阅读 · 2022年1月11日

为什么说对抗性图像攻击不是闹着玩的？

AI前线

1+阅读 · 2022年1月5日

又改YOLO | 项目如何改进YOLOv5？这篇告诉你如何修改让检测更快、更稳！！！

专知

0+阅读 · 2021年12月28日

AAAI 2022 | 无注意力+PatchOut，复旦大学提出面向视觉transformer的迁移攻击方法

机器之心

0+阅读 · 2021年12月28日

图神经网络的对抗标签翻转攻击与防御

专知

0+阅读 · 2021年3月28日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

论文笔记之Meta-Tracker（ECCV2018）

统计学习与视觉计算组

16+阅读 · 2018年8月24日

STRCF for Visual Object Tracking

统计学习与视觉计算组

15+阅读 · 2018年5月29日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

卟啉修饰氧化石墨烯复合材料的微观结构与非线性光学性能调控研究

国家自然科学基金

0+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

多参数关联传感的高分辨力位移测量新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

事件触发分布式模型预测控制方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

超轻多孔"类蜂窝"夹层结构材料创新构型及其结构-材料性能一体化设计方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多标记学习的蛋白质亚细胞多位置预测方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

非线性参数可调的碳纳米管吸收体研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于微声学谐振腔的低检出限生物传感

国家自然科学基金

0+阅读 · 2012年12月31日

传感器网络下分布式多目标跟踪方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

异常检测的方法研究及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

Solving The Long-Tailed Problem via Intra- and Inter-Category Balance

Arxiv

0+阅读 · 2022年4月20日

Nested Collaborative Learning for Long-Tailed Visual Recognition

Arxiv

0+阅读 · 2022年4月19日

Detecting, Tracking and Counting Motorcycle Rider Traffic Violations on Unconstrained Roads

Arxiv

0+阅读 · 2022年4月18日

Rethinking Rotated Object Detection with Gaussian Wasserstein Distance Loss

Arxiv

0+阅读 · 2022年4月18日

Deep Learning-based List Sphere Decoding for Faster-than-Nyquist (FTN) Signaling Detection

Arxiv

0+阅读 · 2022年4月15日

FasterVideo: Efficient Online Joint Object Detection And Tracking

Arxiv

0+阅读 · 2022年4月15日

Early Myocardial Infarction Detection with One-Class Classification over Multi-view Echocardiography

Arxiv

0+阅读 · 2022年4月14日

Knowledge Distillation for Object Detection via Rank Mimicking and Prediction-guided Feature Imitation

Arxiv

11+阅读 · 2021年12月9日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

VIP会员