本研究首次对DINO训练的自监督视觉Transformers 对抗攻击的鲁棒性进行了分析。首先,我们评估通过自监督学习的特征是否比通过监督学习学习的特征更能抵御对抗性攻击。然后,我们提出了在潜在空间中攻击所产生的性质。最后,我们评估了三种众所周知的防御策略是否可以增加下游任务的对抗鲁棒性,即使在有限的计算资源下,仅通过微调分类头来提供鲁棒性。这些防御策略是:对抗性训练、集成对抗性训练和专业网络集成。
https://www.zhuanzhi.ai/paper/1fd3439a6ac6312d164fc46827f9cbb2