Traffic Sign Recognition (TSR) systems play a critical role in Autonomous Driving (AD) systems, enabling real-time detection of road signs, such as STOP and speed limit signs. While these systems are increasingly integrated into commercial vehicles, recent research has exposed their vulnerability to physical-world adversarial appearance attacks. In such attacks, carefully crafted visual patterns are misinterpreted by TSR models as legitimate traffic signs, while remaining inconspicuous or benign to human observers. However, existing adversarial appearance attacks suffer from notable limitations. Pixel-level perturbation-based methods often lack stealthiness and tend to overfit to specific surrogate models, resulting in poor transferability to real-world TSR systems. On the other hand, text-to-image (T2I) diffusion model-based approaches demonstrate limited effectiveness and poor generalization to out-of-distribution sign types. In this paper, we present DiffSign, a novel T2I-based appearance attack framework designed to generate physically robust, highly effective, transferable, practical, and stealthy appearance attacks against TSR systems. To overcome the limitations of prior approaches, we propose a carefully designed attack pipeline that integrates CLIP-based loss and masked prompts to improve attack focus and controllability. We also propose two novel style customization methods to guide visual appearance and improve out-of-domain traffic sign attack generalization and attack stealthiness. We conduct extensive evaluations of DiffSign under varied real-world conditions, including different distances, angles, light conditions, and sign categories. Our method achieves an average physical-world attack success rate of 83.3%, leveraging DiffSign's high effectiveness in attack transferability.


翻译:交通标志识别(TSR)系统在自动驾驶(AD)系统中发挥着关键作用,能够实时检测道路标志,如停车标志和限速标志。尽管这些系统已越来越多地集成到商用车辆中,但近期研究揭示了它们对物理世界对抗性外观攻击的脆弱性。在此类攻击中,精心设计的视觉模式会被TSR模型误判为合法的交通标志,而对人类观察者而言却保持隐蔽或无害。然而,现有的对抗性外观攻击存在显著局限性。基于像素级扰动的方法通常缺乏隐蔽性,且容易对特定代理模型过拟合,导致对真实世界TSR系统的可迁移性较差。另一方面,基于文本到图像(T2I)扩散模型的方法在有效性方面表现有限,且对分布外标志类型的泛化能力不足。本文提出DiffSign,一种新颖的基于T2I的外观攻击框架,旨在生成物理鲁棒、高效、可迁移、实用且隐蔽的外观攻击,以针对TSR系统。为克服先前方法的局限性,我们设计了一种精心构建的攻击流程,集成基于CLIP的损失函数和掩码提示,以提升攻击聚焦性和可控性。同时,我们提出了两种新颖的风格定制方法,以引导视觉外观并改善域外交通标志攻击的泛化能力与攻击隐蔽性。我们在多种真实世界条件下对DiffSign进行了广泛评估,包括不同距离、角度、光照条件和标志类别。实验结果表明,我们的方法在物理世界攻击中平均成功率达到了83.3%,这得益于DiffSign在攻击可迁移性方面的高效表现。

0
下载
关闭预览

相关内容

【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
43+阅读 · 2021年3月8日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员