Stochastic disruptions such as flash events arising from benign traffic bursts and switch thermal fluctuations are major contributors to intermittent service degradation in software-defined industrial networks. These events violate IEC~61850-derived quality-of-service requirements and user-defined service-level agreements, hindering the reliable and timely delivery of control, monitoring, and best-effort traffic in IEC~61400-25-compliant wind power plants. Failure to maintain these requirements often results in delayed or lost control signals, reduced operational efficiency, and increased risk of wind turbine generator downtime. To address these challenges, this study proposes a threshold-triggered Deep Q-Network self-healing agent that autonomically detects, analyzes, and mitigates network disruptions while adapting routing behavior and resource allocation in real time. The proposed agent was trained, validated, and tested on an emulated tri-clustered switch network deployed in a cloud-based proof-of-concept testbed. Simulation results show that the proposed agent improves disruption recovery performance by 53.84% compared to a baseline shortest-path and load-balanced routing approach and outperforms state-of-the-art methods, including the Adaptive Network-based Fuzzy Inference System by 13.1% and the Deep Q-Network and traffic prediction-based routing optimization method by 21.5%, in a super-spine leaf data-plane architecture. Additionally, the agent maintains switch thermal stability by proactively initiating external rack cooling when required. These findings highlight the potential of deep reinforcement learning in building resilience in software-defined industrial networks deployed in mission-critical, time-sensitive application scenarios.


翻译:随机性中断,如良性流量突发和交换机热波动引发的闪发事件,是软件定义工业网络中导致间歇性服务降级的主要原因。这些事件违反了基于IEC~61850的服务质量要求以及用户定义的服务水平协议,阻碍了符合IEC~61400-25标准的风力发电厂中控制、监控和尽力而为流量的可靠及时传输。未能维持这些要求通常会导致控制信号延迟或丢失、运行效率降低,并增加风力涡轮发电机停机的风险。为应对这些挑战,本研究提出了一种阈值触发的深度Q网络自愈代理,能够自主检测、分析并缓解网络中断,同时实时调整路由行为和资源分配。该代理在一个基于云的概念验证测试平台中部署的模拟三集群交换机网络上进行了训练、验证和测试。仿真结果表明,与基线的最短路径和负载均衡路由方法相比,所提出的代理将中断恢复性能提高了53.84%,并在超骨干叶数据平面架构中优于现有先进方法,包括自适应网络模糊推理系统(提升13.1%)以及基于深度Q网络和流量预测的路由优化方法(提升21.5%)。此外,该代理通过必要时主动启动外部机架冷却,保持了交换机的热稳定性。这些发现突显了深度强化学习在部署于关键任务、时间敏感应用场景的软件定义工业网络中构建弹性的潜力。

0
下载
关闭预览

相关内容

IPSec | IKE密钥交换原理
计算机与网络安全
18+阅读 · 2018年12月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员