会员服务 ·

Hinton领衔谷歌大脑新研究，拯救被认成步枪的乌龟

2018 年 11 月 20 日 量子位

栗子安妮编译整理
量子位出品 | 公众号 QbitAI

最近，深度学习之父Geoffrey Hinton带领的谷歌大脑团队，提出了一种防御对抗攻击的新方法。

一种叫作DARCCC的技术，能将重构图像和输入图像作对比，继而识别出对抗图像，检测系统有没有受到攻击。

对抗攻击，是一种专职欺骗图片识别AI的方法。此前，那个广为流传的AI将乌龟识别成步枪的操作，就是对抗攻击的杰作。

悄悄修改图片的纹理，就可以在人类毫无察觉的情况下，骗过AI。

不过这一次，对抗攻击遇到了对手。

利用对抗攻击的弱点

虽然，对抗攻击是种高超的骗术，但也有弱点。

还以乌龟和步枪的故事为栗：

即便和步枪分在一类，乌龟还是和步枪长得很不一样。

Hinton团队就是利用它们之间的区别，来把那些分类错误的图像，从大部队里揪出来。

模型识别图像的时候，除了输出一个分类 (如乌龟/步枪) ，还会输出一个重构 (Reconstruction) 的图像。

如果是对抗图像，重构出来会和原图差别很大 (在AI眼里已靠近步枪) 。若是未加篡改的真实图像，重构结果应该和输入图像 (乌龟) 很接近：

△ 受到白盒攻击之后，AI看到的东西，已经变了

所以，要做一个识别算法，就先给验证集的重构误差 (Reconstruction Error) 定义一个阈值。

只要一张图的重构误差超过这个阈值，就把它标记成对抗图像。

△ 输入与重构之间的距离

如此，这个算法就可以识别出，系统有没有受到不明力量的攻击。

魔高一尺，道高一丈

随后，研究人员将DARCCC扩展到更多标准图像分类网络中，进一步探索这种检测方法在黑盒攻击和典型的白盒攻击下是否有效。

Frosst等人选用MNIST、Fashion-MNIST和SVHN三个数据集，进行下一步：有效性验证。这一次，研究人员用了三种常用的白盒攻击方法。

前两种是白盒攻击中的常用的FGSM（Fast Gradient Sign Method）和BIM（Basic Iterative Methods）算法，这两次的结果让研究人员兴奋，因为这两种日常方法都没有攻击成功。

虽然DARCCC抵挡住FGSM和BIM的攻势，但在第三种白盒攻击面前，还是败下阵来。

这种更强大的白盒攻击，叫做R-BIM（Reconstructive BIM）。可以把重构损失计算在内，不断迭代地扰乱图片。

这样一来，就算是对抗图像，AI还是可以为它生成一个优雅的重构。

系统就没有办法检测到攻击了。

这是在MNIST和fashionMNIST数据集中检测时的结果：

当用SVHN数据集检测时，结果如下：

传送门

目前，这篇论文DARCCC: Detecting Adversaries by Reconstruction from Class Conditional Capsules已经被NeurIPS的安全Workshop收录。

论文地址：

https://arxiv.org/abs/1811.06969

Frosst推特原文：

https://twitter.com/nickfrosst/status/1064593651026792448

— 完 —

年度评选申请

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

对抗攻击

关注 14

超越深度学习：梯度提升机Gradient Boosting Machines (GBM)，73页ppt

专知会员服务

52+阅读 · 2020年6月21日

【伯克利】黑盒机器翻译系统的模仿攻击与防御，Imitation Attacks and Defenses for Black-box Machine Translation Systems

专知会员服务

8+阅读 · 2020年5月4日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

专知会员服务

54+阅读 · 2020年3月16日

Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新ImageNet准确率

专知会员服务

36+阅读 · 2020年3月11日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

24+阅读 · 2020年2月22日

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【论文】量子对抗机器学习，Quantum Adversarial Machine Learning

专知会员服务

38+阅读 · 2020年1月5日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【AAAI 2019 Tutorial】对抗机器学习（Adversarial Machine Learning），Bo Li，Dawn Song，Yevgeniy Vorobeychik

专知会员服务

29+阅读 · 2019年11月18日

你真的懂对抗样本吗？一文重新思考对抗样本背后的含义

机器之心

5+阅读 · 2019年9月16日

Hinton老爷子CapsNet再升级，结合无监督，接近当前最佳效果

机器之心

5+阅读 · 2019年6月20日

对抗样本并非bug，它们只是特征罢了

机器之心

8+阅读 · 2019年5月9日

新式隐身术：只要在肚子上贴一张图片，AI就当你不存在

果壳网

5+阅读 · 2019年4月28日

一张贴纸欺骗AI，对抗性补丁让人类隐身，监控摄像危险了！

新智元

5+阅读 · 2019年4月24日

L2正则化视角下的对抗样本

极市平台

7+阅读 · 2018年7月13日

揭秘|多伦多大学反人脸识别，身份欺骗成功率达99.5%

机器人大讲堂

6+阅读 · 2018年6月9日

变分自编码器VAE：原来是这么一回事 | 附开源代码

PaperWeekly

12+阅读 · 2018年3月23日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

谷歌的AI将乌龟认成步枪，这为何是个大问题

硅谷第一线

3+阅读 · 2017年11月22日

ASLFeat: Learning Local Features of Accurate Shape and Localization

Arxiv

6+阅读 · 2020年3月23日

On Feature Normalization and Data Augmentation

Arxiv

15+阅读 · 2020年2月25日

CapsAttacks: Robust and Imperceptible Adversarial Attacks on Capsule Networks

Arxiv

4+阅读 · 2019年5月24日

Two-phase Hair Image Synthesis by Self-Enhancing Generative Model

Arxiv

3+阅读 · 2019年2月28日

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

q-Space Novelty Detection with Variational Autoencoders

Arxiv

3+阅读 · 2018年10月25日

Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

Arxiv

4+阅读 · 2018年9月23日

Acquisition of Localization Confidence for Accurate Object Detection

Arxiv

4+阅读 · 2018年7月30日

Attacking Visual Language Grounding with Adversarial Examples: A Case Study on Neural Image Captioning

Arxiv

4+阅读 · 2018年5月22日

On the Robustness of the CVPR 2018 White-Box Adversarial Example Defenses

Arxiv

3+阅读 · 2018年4月10日

VIP会员

Hinton领衔谷歌大脑新研究，拯救被认成步枪的乌龟

栗子 安妮 编译整理量子位 出品 | 公众号 QbitAI

利用对抗攻击的弱点

△ 受到白盒攻击之后，AI看到的东西，已经变了

△ 输入与重构之间的距离

魔高一尺，道高一丈

传送门

相关内容

栗子安妮编译整理
量子位出品 | 公众号 QbitAI