Simulation-based testing is the standard practice for assessing the reliability of self-driving cars' software before deployment. Existing bug-finding techniques are either unreliable or expensive. We build on the insight that near misses observed during simulations may point to potential failures. We propose Foresee, a technique that identifies near misses using a misbehavior forecaster that computes possible future states of the ego-vehicle under test. Foresee performs local fuzzing in the neighborhood of each candidate near miss to surface previously unknown failures. In our empirical study, we evaluate the effectiveness of different configurations of Foresee using several scenarios provided in the CARLA simulator on both end-to-end and modular self-driving systems and examine its complementarity with the state-of-the-art fuzzer DriveFuzz. Our results show that Foresee is both more effective and more efficient than the baselines. Foresee exposes 128.70% and 38.09% more failures than a random approach and a state-of-the-art failure predictor while being 2.49x and 1.42x faster, respectively. Moreover, when used in combination with DriveFuzz, Foresee enhances failure detection by up to 93.94%.


翻译:基于仿真的测试是评估自动驾驶汽车软件在部署前可靠性的标准实践。现有的缺陷发现技术要么不可靠,要么成本高昂。我们的研究基于以下洞见:在仿真过程中观察到的"险情"可能预示着潜在的故障。我们提出了Foresee,一种利用误行为预测器识别险情的技术,该预测器计算被测自车在未来的可能状态。Foresee在每个候选险情的邻域内执行局部模糊测试,以揭示先前未知的故障。在我们的实证研究中,我们使用CARLA模拟器提供的多个场景,在端到端和模块化自动驾驶系统上评估了Foresee不同配置的有效性,并检验了其与最先进的模糊测试工具DriveFuzz的互补性。我们的结果表明,Foresee比基线方法更有效且更高效。与随机方法和最先进的故障预测器相比,Foresee暴露的故障分别多出128.70%和38.09%,同时速度分别快2.49倍和1.42倍。此外,当与DriveFuzz结合使用时,Foresee将故障检测率最高提升了93.94%。

0
下载
关闭预览

相关内容

国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员