Certified robustness guarantee gauges a model's robustness to test-time attacks and can assess the model's readiness for deployment in the real world. In this work, we critically examine how the adversarial robustness guarantees from randomized smoothing-based certification methods change when state-of-the-art certifiably robust models encounter out-of-distribution (OOD) data. Our analysis demonstrates a previously unknown vulnerability of these models to low-frequency OOD data such as weather-related corruptions, rendering these models unfit for deployment in the wild. To alleviate this issue, we propose a novel data augmentation scheme, FourierMix, that produces augmentations to improve the spectral coverage of the training data. Furthermore, we propose a new regularizer that encourages consistent predictions on noise perturbations of the augmented data to improve the quality of the smoothed models. We find that FourierMix augmentations help eliminate the spectral bias of certifiably robust models enabling them to achieve significantly better robustness guarantees on a range of OOD benchmarks. Our evaluation also uncovers the inability of current OOD benchmarks at highlighting the spectral biases of the models. To this end, we propose a comprehensive benchmarking suite that contains corruptions from different regions in the spectral domain. Evaluation of models trained with popular augmentation methods on the proposed suite highlights their spectral biases and establishes the superiority of FourierMix trained models at achieving better-certified robustness guarantees under OOD shifts over the entire frequency spectrum.


翻译:我们的分析表明,这些模型在先前未知的低频OOD数据(如与天气有关的腐败)上的脆弱性,这些模型对于与天气有关的腐败等低频 OOD数据的脆弱性,使得这些模型不适于在野外部署。为了缓解这一问题,我们提议了一个新的数据扩充计划,即FreyierMix,我们提议了一个新的数据扩充计划,以产生增强值来提高培训数据的光谱覆盖范围;此外,我们提议一个新的定期化机制,鼓励对更新数据的噪音振动作出一致的预测,以提高光谱模型的质量。我们发现,FourierMix 增强有助于消除这些模型对与天气有关的腐败等低频度 OOOD数据(如与天气有关的腐败)数据的频谱偏差偏差。为了缓解这一问题,我们提议建立一个新的数据扩充计划,即FreyierMMix,产生增强值的增强值,以提高培训数据光谱范围的光谱覆盖面。此外,我们提议一个新的定期化机制,鼓励对更新的数据的噪音作出一致预测,以便提高数据质量。

0
下载
关闭预览

相关内容

专知会员服务
42+阅读 · 2021年4月2日
最新《Transformers模型》教程,64页ppt
专知会员服务
314+阅读 · 2020年11月26日
专知会员服务
45+阅读 · 2020年10月31日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
已删除
将门创投
7+阅读 · 2018年8月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
4+阅读 · 2019年11月21日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
Arxiv
7+阅读 · 2018年6月8日
VIP会员
相关资讯
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
已删除
将门创投
7+阅读 · 2018年8月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员