Zero-Touch Networks (ZTNs) represent a transformative paradigm toward fully automated and intelligent network management, providing the scalability and adaptability required for the complexity of sixth-generation (6G) networks. However, the distributed architecture, high openness, and deep heterogeneity of 6G networks expand the attack surface and pose unprecedented security challenges. To address this, security automation aims to enable intelligent security management across dynamic and complex environments, serving as a key capability for securing 6G ZTNs. Despite its promise, implementing security automation in 6G ZTNs presents two primary challenges: 1) automating the lifecycle from security strategy generation to validation and update under real-world, parallel, and adversarial conditions, and 2) adapting security strategies to evolving threats and dynamic environments. This motivates us to propose SecLoop and SA-GRPO. SecLoop constitutes the first fully automated framework that integrates large language models (LLMs) across the entire lifecycle of security strategy generation, orchestration, response, and feedback, enabling intelligent and adaptive defenses in dynamic network environments, thus tackling the first challenge. Furthermore, we propose SA-GRPO, a novel security-aware group relative policy optimization algorithm that iteratively refines security strategies by contrasting group feedback collected from parallel SecLoop executions, thereby addressing the second challenge. Extensive real-world experiments on five benchmarks, including 11 MITRE ATT&CK processes and over 20 types of attacks, demonstrate the superiority of the proposed SecLoop and SA-GRPO. We will release our platform to the community, facilitating the advancement of security automation towards next generation communications.


翻译:零接触网络(ZTNs)代表了一种向全自动智能化网络管理的变革性范式,为第六代(6G)网络的复杂性提供了所需的可扩展性与适应性。然而,6G网络的分布式架构、高度开放性和深度异构性扩大了攻击面,带来了前所未有的安全挑战。为此,安全自动化旨在实现动态复杂环境下的智能安全管理,成为保障6G零接触网络安全的关键能力。尽管前景广阔,在6G零接触网络中实施安全自动化仍面临两大挑战:1)在现实世界并行对抗条件下,实现从安全策略生成到验证与更新的全生命周期自动化;2)使安全策略适应不断演变的威胁与动态环境。这促使我们提出SecLoop与SA-GRPO。SecLoop是首个将大语言模型(LLMs)集成于安全策略生成、编排、响应与反馈全生命周期的全自动化框架,能在动态网络环境中实现智能自适应防御,从而应对第一个挑战。此外,我们提出SA-GRPO——一种新颖的安全感知群体相对策略优化算法,通过对比从并行SecLoop执行中收集的群体反馈来迭代优化安全策略,进而解决第二个挑战。在包含11个MITRE ATT&CK流程及超过20种攻击类型的五个基准测试上进行的大规模真实环境实验,证明了所提SecLoop与SA-GRPO的优越性。我们将向社区开放平台,以推动安全自动化技术面向下一代通信的发展。

0
下载
关闭预览

相关内容

一种Agent自主性风险评估框架 | 最新文献
专知会员服务
16+阅读 · 10月24日
《自动化的网络防御:综述》2023最新32页长综述
专知会员服务
33+阅读 · 2023年6月19日
专知会员服务
22+阅读 · 2021年8月20日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员