本文通过整合数字孪生仿真与生成式AI驱动场景训练,对EdgeAgentX框架进行全方位扩展,以增强军事网络边缘智能。EdgeAgentX-DT利用网络数字孪生(战术网络的虚拟镜像)与现实边缘设备实时同步,构建安全高保真训练测试环境。在此基础上,生成式AI(含扩散模型与Transformer架构)生成多样化对抗场景供智能体在仿真中体验。该融合方案使边缘智能体能在广泛条件下学习鲁棒通信协调策略,规避任务资产风险。系统详细阐述EdgeAgentX-DT的三层架构:1)设备端边缘智能层 2)数字孪生同步层 3)生成式场景训练层。仿真实验表明相较原始EdgeAgentX,集成数字孪生与生成式AI显著提升性能——加速学习收敛、提高网络吞吐量、降低时延、增强抗干扰与故障韧性。复杂战术场景案例研究(复合干扰攻击、智能体故障与网络负载激增)验证了EdgeAgentX-DT在基准方法失效时仍维持作战效能。结果凸显数字孪生赋能的生成式训练在对抗环境下部署边缘AI的应用前景。全文涵盖方法导论、系统架构、技术路径、实验评估、发现讨论及结论。

现代军事通信网络日益依赖战术边缘运行的智能自主体。美国防部强调战术边缘需具备抗逆性...在无人监督时自主执行任务并自适应变化,亟需边缘AI智能体在动态对抗环境中独立学习决策。近期提出的EdgeAgentX框架通过融合联邦学习(FL)、多智能体深度强化学习(MARL)与对抗防御三层架构应对此需求。原始EdgeAgentX中,分布式边缘设备网络通过集中训练分散执行的MADDPG算法协同优化通信策略(如最小化时延或最大化吞吐量),性能超越独立学习体。内置对抗AI防御机制(鲁棒聚合、对抗训练、安全协议)确保系统在干扰或模型投毒攻击下保持稳定。实验证明EdgeAgentX相较基准方法(独立RL、标准FL等)实现显著更低的时延、更高的吞吐量与更快的收敛速度,且在模拟攻击下保持韧性。

扩展动因:尽管EdgeAgentX成效显著,但为应对现实场景全频谱挑战仍需突破关键瓶颈。原始框架依赖有限训练阶段接触的环境,而真实战场可能出现罕见极端状况(强干扰、节点突发故障、流量激增、未知对抗策略)。传统模拟器或领域随机化虽能提供有限多样性,却难以覆盖广谱演进的战术场景空间。此时两项新兴技术凸显价值:数字孪生与生成式AI。

数字孪生作为物理系统的实时虚拟镜像(此处指通信网络及其环境),动态映射真实网络拓扑、状态与行为,为各类情境下的网络性能分析预测提供安全沙箱。网络数字孪生被誉为网络管理的革命性工具,支持无风险"假设推演"。对战术网络而言,数字孪生可模拟战场环境(机动性、地形、射频传播)并与现网同步响应变化。该虚拟环境能预训练边缘智能体并验证高风险/低频场景。研究表明将数字孪生融入训练循环可显著提升学习效率与泛化能力。例如Du等人(2023)证实:集成数字孪生的DRL智能体达到同等性能所需训练交互量仅为标准DRL智能体的三分之一。数字孪生提供额外离线探索机会,加速收敛并产生更鲁棒策略。

生成式AI(GenAI)则提供创建合成数据与场景的创新路径。扩散模型与Transformer等生成模型能学习网络状态/事件的复杂分布,通过采样生成逼真变异。近期研究应用扩散模型生成高度拟真的合成网络场景,为算法测试验证提供强健平台。与传统随机扰动不同,生成式AI可产出兼具多样性与针对性的场景变异(含边界案例与对抗条件)。例如生成模型能创建各类干扰模式、流量激增事件或故障级联,对智能体策略实施压力测试。通过在AI生成场景的广谱分布上训练,智能体可应对超越单一真实数据集的情景。该方法类似自动化课程:对抗性或受控生成过程逐步增强挑战难度。PAIRED(主角-对手诱导遗憾环境设计)等技术通过训练独立对手智能体构建超越主角当前能力的困难环境以提升鲁棒泛化性。但本框架无需独立对手智能体,直接利用生成式AI工具模拟对抗条件。

核心贡献:本文在EdgeAgentX基础上融合数字孪生技术与生成式场景训练,构建EdgeAgentX-DT框架。核心创新如下:
• 数字孪生集成架构:设计新型多层架构,网络实时数字孪生与物理边缘网络并行运行。孪生体持续同步真实环境状态(链路质量、节点位置、流量水平等),为智能体训练与策略评估提供虚拟试验场,增强态势感知并支持前瞻自适应。
• 生成式场景引擎:集成生成式AI驱动的场景生成模块,在数字孪生内产出多样化训练场景。基于扩散概率模型与Transformer序列生成技术,系统可模拟从常规变异到最坏对抗事件的全谱条件。这些场景扩充智能体训练数据,使其接触远超现实的经验谱系。
• 增强型多层学习流程:详述联邦学习与多智能体强化学习如何协同数字孪生及生成式AI组件。系统通过双环协同运作:外环通过现实数据持续校准数字孪生,内环在孪生体(含生成场景)中训练优化策略。虚实经验交替加速收敛并提升策略鲁棒性,避免过度现实实验。
• 仿真性能增益:通过大规模仿真对比EdgeAgentX-DT与原始框架及基准方法。结果呈现显著提升:学习收敛加速(以更少训练轮次达目标性能)、常规/压力条件下吞吐量提升与时延降低、对抗干扰韧性增强。例如在强干扰下EdgeAgentX-DT智能体保持比原始框架高约10-15%的吞吐量,训练收敛速度快20%。该发现与既往研究(数字孪生增强学习可加速收敛并平滑损失曲面)一致。
• 案例研究——复杂战术场景:详述包含三重同步挑战的场景(干扰致网络退化、边缘节点故障、流量突发激增),定性定量展示EdgeAgentX-DT如何通过数字孪生与生成式训练维持系统自适应与性能稳定(传统方法则表现挣扎)。该案例为军事实战部署提供洞见,例如预测并缓解电子对抗战术对通信的影响。

本研究开创性地在战术网络领域融合边缘学习、数字孪生与生成式AI技术。据我们所知,EdgeAgentX-DT是首个整合全要素的实战部署框架。全文结构如下:第二章详述EdgeAgentX-DT系统模型与架构;第三章阐明数字孪生同步流程与生成式场景训练方法;第四章展示实验评估结果;第五章探讨应用挑战与部署考量;第六章总结并展望未来方向。

图1. EdgeAgentX-DT系统架构。该框架包含三层结构:(i)边缘智能层:分布式边缘智能体(如战术电台、无人机、物联网传感器)执行本地学习并参与联邦学习(FL)实现全局模型更新;(ii)数字孪生同步层:镜像真实网络状态的虚拟环境,通过现场数据持续更新;(iii)生成式AI场景训练层:运用生成模型向数字孪生注入合成场景(如模拟干扰或故障)以强化训练。本设计在原始EdgeAgentX三层架构上升级,以前沿数字孪生与生成式AI驱动训练层替代既有对抗防御覆盖层。数字孪生层使系统能模拟物理传感器无法观测的条件(如多变气象或敌方干扰),为训练测试提供增量数据。顶层生成式AI层依托该虚拟环境生成多样化"假设推演"场景(如节点突发故障、流量激增、新型干扰战术),训练边缘智能体应对边界案例。通过在AI生成场景广谱训练,EdgeAgentX-DT智能体获得可泛化至不可预测情境的鲁棒策略。层级间箭头表征持续反馈循环:现场数据与学习策略上行更新孪生体并驱动场景生成,优化策略与洞察结果下行部署至边缘。

成为VIP会员查看完整内容
2

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
微信扫码咨询专知VIP会员