Assessing the safety of autonomous driving policy is of great importance, and reinforcement learning (RL) has emerged as a powerful method for discovering critical vulnerabilities in driving policies. However, existing RL-based approaches often struggle to identify vulnerabilities that are both effective-meaning the autonomous vehicle is genuinely responsible for the accidents-and diverse-meaning they span various failure types. To address these challenges, we propose AED, a framework that uses large language models (LLMs) to automatically discover effective and diverse vulnerabilities in autonomous driving policies. We first utilize an LLM to automatically design reward functions for RL training. Then we let the LLM consider a diverse set of accident types and train adversarial policies for different accident types in parallel. Finally, we use preference-based learning to filter ineffective accidents and enhance the effectiveness of each vulnerability. Experiments across multiple simulated traffic scenarios and tested policies show that AED uncovers a broader range of vulnerabilities and achieves higher attack success rates compared with expert-designed rewards, thereby reducing the need for manual reward engineering and improving the diversity and effectiveness of vulnerability discovery. The implementation can be found on: https://github.com/thu-nics/AED .


翻译:评估自动驾驶策略的安全性至关重要,强化学习已成为发现驾驶策略关键漏洞的有力方法。然而,现有的基于强化学习的方法往往难以识别同时具备有效性(即自动驾驶车辆确实对事故负有责任)和多样性(即涵盖多种故障类型)的漏洞。为应对这些挑战,我们提出了AED框架,该框架利用大语言模型自动发现自动驾驶策略中有效且多样化的漏洞。我们首先使用大语言模型自动设计用于强化学习训练的价值函数,随后让大语言模型考虑多样化的事故类型集合并并行训练针对不同事故类型的对抗策略,最后通过基于偏好的学习筛选无效事故并提升每个漏洞的有效性。在多个模拟交通场景和测试策略上的实验表明,相较于专家设计的价值函数,AED能够发现更广泛的漏洞类型并实现更高的攻击成功率,从而减少手动设计价值函数的需求,并提升漏洞发现的多样性与有效性。实现代码可见:https://github.com/thu-nics/AED。

0
下载
关闭预览

相关内容

CosFace: Large Margin Cosine Loss for Deep Face Recognition论文笔记
统计学习与视觉计算组
44+阅读 · 2018年4月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员