Automating the translation of natural language (NL) software requirements into formal specifications remains a critical challenge in scaling formal verification practices to industrial settings, particularly in safety-critical domains. Existing approaches, both rule-based and learning-based, face significant limitations. While large language models (LLMs) like GPT-4o demonstrate proficiency in semantic extraction, they still encounter difficulties in addressing the complexity, ambiguity, and logical depth of real-world industrial requirements. In this paper, we propose Req2LTL, a modular framework that bridges NL and Linear Temporal Logic (LTL) through a hierarchical intermediate representation called OnionL. Req2LTL leverages LLMs for semantic decomposition and combines them with deterministic rule-based synthesis to ensure both syntactic validity and semantic fidelity. Our comprehensive evaluation demonstrates that Req2LTL achieves 88.4% semantic accuracy and 100% syntactic correctness on real-world aerospace requirements, significantly outperforming existing methods.


翻译:将自然语言软件需求自动转化为形式化规约,对于在工业场景(尤其是安全关键领域)规模化应用形式化验证技术仍是一个关键挑战。现有基于规则或学习的方法均存在显著局限。尽管GPT-4o等大语言模型在语义提取方面表现出色,但在处理实际工业需求的复杂性、歧义性和逻辑深度时仍面临困难。本文提出Req2LTL——一种通过名为OnionL的层次化中间表示来连接自然语言与线性时序逻辑的模块化框架。该框架利用大语言模型进行语义分解,并结合确定性规则合成方法,从而同时保证句法有效性与语义保真度。我们在真实航空航天需求数据集上的综合评估表明,Req2LTL实现了88.4%的语义准确率与100%的句法正确率,显著优于现有方法。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员