Neural network (NN) verification aims to formally verify properties of NNs, which is crucial for ensuring the behavior of NN-based models in safety-critical applications. In recent years, the community has developed many NN verifiers and benchmarks to evaluate them. However, existing benchmarks typically lack ground-truth for hard instances where no current verifier can verify the property and no counterexample can be found. This makes it difficult to validate the soundness of a verifier, when it claims verification on such challenging instances that no other verifier can handle. In this work, we develop a new benchmark for NN verification, named SoundnessBench, specifically for testing the soundness of NN verifiers. SoundnessBench consists of instances with deliberately inserted counterexamples that are hidden from adversarial attacks commonly used to find counterexamples. Thereby, it can identify false verification claims when hidden counterexamples are known to exist. We design a training method to produce NNs with hidden counterexamples and systematically construct our SoundnessBench with instances across various model architectures, activation functions, and input data. We demonstrate that our training effectively produces hidden counterexamples and our SoundnessBench successfully identifies bugs in state-of-the-art NN verifiers. Our code is available at https://github.com/mvp-harry/SoundnessBench and our dataset is available at https://huggingface.co/datasets/SoundnessBench/SoundnessBench.


翻译:神经网络(NN)验证旨在形式化验证神经网络的属性,这对于确保基于神经网络的模型在安全关键应用中的行为至关重要。近年来,研究社区已开发出许多神经网络验证器及相应的基准测试来评估它们。然而,现有基准测试通常缺乏对于困难实例的真实基准,即当前没有任何验证器能够验证属性且无法找到反例的情况。这使得当验证器声称能够处理其他验证器无法应对的此类挑战性实例时,难以验证其可靠性。在本工作中,我们开发了一个名为SoundnessBench的神经网络验证新基准,专门用于测试神经网络验证器的可靠性。SoundnessBench包含经过精心设计插入反例的实例,这些反例对常用于寻找反例的对抗性攻击具有隐蔽性。因此,当已知存在隐蔽反例时,该基准能够识别错误的验证声明。我们设计了一种训练方法来生成具有隐蔽反例的神经网络,并系统性地构建了涵盖多种模型架构、激活函数和输入数据的SoundnessBench实例。我们证明了我们的训练方法能有效生成隐蔽反例,且SoundnessBench成功识别了最先进神经网络验证器中的缺陷。我们的代码可在https://github.com/mvp-harry/SoundnessBench获取,数据集可在https://huggingface.co/datasets/SoundnessBench/SoundnessBench获取。

0
下载
关闭预览

相关内容

【AAAI2025】TimeDP:通过领域提示学习生成多领域时间序列
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员