Adversarial robustness is a key concept in measuring the ability of neural networks to defend against adversarial attacks during the inference phase. Recent studies have shown that despite the success of improving adversarial robustness against a single type of attack using robust training techniques, models are still vulnerable to diversified $\ell_p$ attacks. To achieve diversified $\ell_p$ robustness, we propose a novel robust mode connectivity (RMC)-oriented adversarial defense that contains two population-based learning phases. The first phase, RMC, is able to search the model parameter space between two pre-trained models and find a path containing points with high robustness against diversified $\ell_p$ attacks. In light of the effectiveness of RMC, we develop a second phase, RMC-based optimization, with RMC serving as the basic unit for further enhancement of neural network diversified $\ell_p$ robustness. To increase computational efficiency, we incorporate learning with a self-robust mode connectivity (SRMC) module that enables the fast proliferation of the population used for endpoints of RMC. Furthermore, we draw parallels between SRMC and the human immune system. Experimental results on various datasets and model architectures demonstrate that the proposed defense methods can achieve high diversified $\ell_p$ robustness against $\ell_\infty$, $\ell_2$, $\ell_1$, and hybrid attacks. Codes are available at \url{https://github.com/wangren09/MCGR}.


翻译:稳健的模式连通性导向对抗性防御:增强神经网络对多样化的$\ell_p$攻击的稳健性。对抗性稳健性是衡量神经网络在推断阶段防御对抗性攻击能力的关键概念。最近的研究表明,尽管使用稳健训练技术改善了模型对单一类型的攻击的抵御能力,但模型仍然容易受到多样化的 $\ell_{p}$ 攻击的威胁。为了实现多样化的 $\ell_{p}$稳健性,我们提出了一种新颖的稳健模式连通性(Robust Mode Connectivity, RMC)-导向的对抗性防御策略,其中包含两个基于人口学习的阶段。第一阶段为RMC,可以在两个预训练模型之间搜索模型参数空间,并找到包含针对多样化的 $\ell_{p}$ 攻击的高强度点的路径。鉴于 RMC 的有效性,我们开发了第二阶段,基于 RMC 的优化,其中 RMC 用于进一步增强神经网络的多样化的 $\ell_{p}$稳健性。为了提高计算效率,我们结合SRMC模块中的学习,该模块能够启用快速扩展用于 RMC 端点的人口。此外,我们还将 SRMC 和人类免疫系统进行了比较。在各种数据集和模型体系结构上进行的实验结果表明,所提出的防御方法可以实现高的多样化的$\ell_p$稳健性,对 $\ell_{\infty}$、$\ell_{2}$、$\ell_1$ 和混合攻击具有很高的抵御能力。该代码可在 \url{https://github.com/wangren09/MCGR} 上获得。

0
下载
关闭预览

相关内容

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索
【AAAI2022】学会学习可迁移攻击
专知会员服务
15+阅读 · 2021年12月15日
专知会员服务
27+阅读 · 2021年8月2日
专知会员服务
38+阅读 · 2021年6月11日
专知会员服务
19+阅读 · 2021年3月28日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
CVPR 2022 | 子空间对抗训练
PaperWeekly
1+阅读 · 2022年5月31日
ICLR2019 图上的对抗攻击
图与推荐
17+阅读 · 2020年3月15日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2023年5月9日
Arxiv
1+阅读 · 2023年5月8日
Arxiv
12+阅读 · 2020年12月10日
VIP会员
相关VIP内容
【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索
【AAAI2022】学会学习可迁移攻击
专知会员服务
15+阅读 · 2021年12月15日
专知会员服务
27+阅读 · 2021年8月2日
专知会员服务
38+阅读 · 2021年6月11日
专知会员服务
19+阅读 · 2021年3月28日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
13+阅读 · 2021年1月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员