SATBA: 一种基于空间注意力的隐形后门攻击 (SATBA: An Invisible Backdoor Attack Based On Spatial Attention) - 专知论文

会员服务 ·

0

攻击 · 后门攻击 · 注意机制 · 样本 · 智能安全 ·

2023 年 3 月 26 日

SATBA: An Invisible Backdoor Attack Based On Spatial Attention

翻译：SATBA: 一种基于空间注意力的隐形后门攻击

Huasong Zhou,Xiaowei Xu,Xiaodong Wang,Leon Bevan Bullock

from arxiv, 15 pages, 6 figures

Backdoor attacks pose a new and emerging threat to AI security, where Deep Neural Networks (DNNs) are trained on datasets added to hidden trigger patterns. Although the poisoned model behaves normally on benign samples, it produces anomalous results on samples containing the trigger pattern. Nevertheless, most existing backdoor attacks face two significant drawbacks: their trigger patterns are visible and easy to detect by human inspection, and their injection process leads to the loss of natural sample features and trigger patterns, thereby reducing the attack success rate and the model accuracy. In this paper, we propose a novel backdoor attack named SATBA that overcomes these limitations by using spatial attention mechanism and U-type model. Our attack leverages spatial attention mechanism to extract data features and generate invisible trigger patterns that are correlated with clean data. Then it uses U-type model to plant these trigger patterns into the original data without causing noticeable feature loss. We evaluate our attack on three prominent image classification DNNs across three standard datasets and demonstrate that it achieves high attack success rate and robustness against backdoor defenses. Additionally, we also conduct extensive experiments on image similarity to highlight the stealthiness of our attack.

翻译：后门攻击是人工智能安全领域的一种新兴威胁，在这种攻击中，深度神经网络会在数据集中添加隐藏的触发模式进行训练。虽然被毒害的模型在正常样本上表现正常，但它会在包含触发模式的样本上产生异常结果。然而，大多数组后门攻击存在两个重要缺点：它们的触发模式是可见且易于被人工检测的，并且它们的注入过程会导致自然样本特征和触发模式的丢失，从而降低攻击成功率和模型准确率。本文提出了一种名为 SATBA 的新型后门攻击，它通过使用空间注意机制和 U 型模型来克服这些限制。我们的攻击利用空间注意机制提取数据特征并生成与干净数据相关的隐形触发模式，然后使用 U 型模型将这些触发模式注入到原始数据中，而不会引起显著的特征丢失。我们在三个标准数据集上分别对三个著名的图像分类 DNN 进行了攻击评估，并证明它实现了高攻击成功率和抵抗后门防御的稳健性。此外，我们还进行了大量的图像相似性实验，突出了我们攻击的隐秘性。

0

相关内容

【2023新书】理解深度学习，518页pdf，巴斯大学教授Simon J.D. Prince撰著

【2023新书】理解深度学习，518页pdf，巴斯大学教授Simon J.D. Prince撰著

专知会员服务

145+阅读 · 2023年4月19日

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

专知会员服务

4+阅读 · 2022年7月9日

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

专知会员服务

15+阅读 · 2021年1月31日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

专知会员服务

12+阅读 · 2020年4月16日

【CVPR2020-牛津大学】具有自适应邻域一致性的通信网络，Correspondence Networks with Adaptive Neighbourhood Consensus

【CVPR2020-牛津大学】具有自适应邻域一致性的通信网络，Correspondence Networks with Adaptive Neighbourhood Consensus

专知会员服务

16+阅读 · 2020年3月27日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

24+阅读 · 2020年2月22日

【论文推荐】Short Text Classiﬁcation via Term Graph 基于术语图的短文本分类

【论文推荐】Short Text Classiﬁcation via Term Graph 基于术语图的短文本分类

专知会员服务

20+阅读 · 2020年1月20日

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

专知会员服务

32+阅读 · 2019年12月26日

EMNLP 2022 | 北大提出基于中间层特征的在线文本后门防御新SOTA

EMNLP 2022 | 北大提出基于中间层特征的在线文本后门防御新SOTA

PaperWeekly

0+阅读 · 2022年11月7日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

专知

0+阅读 · 2022年7月9日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

静息态皮层-纹状体功能连接在抗精神病药物治疗应答中的作用研究

国家自然科学基金

0+阅读 · 2015年12月31日

TCDD经SSeCKS/TRAF6通路诱导星形胶质细胞激活致神经毒性的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

雄激素受体在膀胱癌进展中对GATA3的调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

杏仁核调控阿片类药物成瘾记忆再巩固的DNA甲基化机制

国家自然科学基金

0+阅读 · 2013年12月31日

黑视素基因转染双极细胞治疗晚期视网膜色素变性

国家自然科学基金

0+阅读 · 2013年12月31日

ATF3在前列腺癌雄激素非依赖性形成中的作用研究

国家自然科学基金

0+阅读 · 2012年12月31日

青少年首发抑郁症执行功能、DTI、fMRI变化及其病理机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

网络边缘实体行为与多态攻击自防御关键技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

UOR: Universal Backdoor Attacks on Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月16日

Capturing Humans' Mental Models of AI: An Item Response Theory Approach

Arxiv

0+阅读 · 2023年5月15日

Tackling Interpretability in Audio Classification Networks with Non-negative Matrix Factorization

Arxiv

0+阅读 · 2023年5月11日

A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented Perspective

Arxiv

21+阅读 · 2022年9月27日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

Composite Adversarial Attacks

Arxiv

12+阅读 · 2020年12月10日

Backdoor Learning: A Survey

Arxiv

14+阅读 · 2020年10月26日

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Arxiv

17+阅读 · 2019年10月9日

VIP会员

文章信息

相关主题

相关VIP内容

【2023新书】理解深度学习，518页pdf，巴斯大学教授Simon J.D. Prince撰著

【2023新书】理解深度学习，518页pdf，巴斯大学教授Simon J.D. Prince撰著

专知会员服务

145+阅读 · 2023年4月19日

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

专知会员服务

4+阅读 · 2022年7月9日

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

专知会员服务

15+阅读 · 2021年1月31日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

专知会员服务

12+阅读 · 2020年4月16日

【CVPR2020-牛津大学】具有自适应邻域一致性的通信网络，Correspondence Networks with Adaptive Neighbourhood Consensus

【CVPR2020-牛津大学】具有自适应邻域一致性的通信网络，Correspondence Networks with Adaptive Neighbourhood Consensus

专知会员服务

16+阅读 · 2020年3月27日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

24+阅读 · 2020年2月22日

【论文推荐】Short Text Classiﬁcation via Term Graph 基于术语图的短文本分类

【论文推荐】Short Text Classiﬁcation via Term Graph 基于术语图的短文本分类

专知会员服务

20+阅读 · 2020年1月20日

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

【WSDM 2020】RecVAE:一种新的变分自编码器，用于具有隐式反馈的Top-N推荐（RecVAE: a New Variational Autoencoder for Top-NRecommendations with Implicit Feedback）

专知会员服务

32+阅读 · 2019年12月26日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

EMNLP 2022 | 北大提出基于中间层特征的在线文本后门防御新SOTA

EMNLP 2022 | 北大提出基于中间层特征的在线文本后门防御新SOTA

PaperWeekly

0+阅读 · 2022年11月7日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

CVPR2022 | 医学图像分析中基于频率注入的后门攻击

专知

0+阅读 · 2022年7月9日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

相关论文

UOR: Universal Backdoor Attacks on Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月16日

Capturing Humans' Mental Models of AI: An Item Response Theory Approach

Arxiv

0+阅读 · 2023年5月15日

Tackling Interpretability in Audio Classification Networks with Non-negative Matrix Factorization

Arxiv

0+阅读 · 2023年5月11日

A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented Perspective

Arxiv

21+阅读 · 2022年9月27日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

Composite Adversarial Attacks

Arxiv

12+阅读 · 2020年12月10日

Backdoor Learning: A Survey

Arxiv

14+阅读 · 2020年10月26日

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Arxiv

17+阅读 · 2019年10月9日

相关基金

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

静息态皮层-纹状体功能连接在抗精神病药物治疗应答中的作用研究

国家自然科学基金

0+阅读 · 2015年12月31日

TCDD经SSeCKS/TRAF6通路诱导星形胶质细胞激活致神经毒性的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

雄激素受体在膀胱癌进展中对GATA3的调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

杏仁核调控阿片类药物成瘾记忆再巩固的DNA甲基化机制

国家自然科学基金

0+阅读 · 2013年12月31日

黑视素基因转染双极细胞治疗晚期视网膜色素变性

国家自然科学基金

0+阅读 · 2013年12月31日

ATF3在前列腺癌雄激素非依赖性形成中的作用研究

国家自然科学基金

0+阅读 · 2012年12月31日

青少年首发抑郁症执行功能、DTI、fMRI变化及其病理机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

网络边缘实体行为与多态攻击自防御关键技术研究

国家自然科学基金

1+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员