As systems engineering (SE) objectives evolve from design and operation of monolithic systems to complex System of Systems (SoS), the discipline of Mission Engineering (ME) has emerged which is increasingly being accepted as a new line of thinking for the SE community. Moreover, mission environments are uncertain, dynamic, and mission outcomes are a direct function of how the mission assets will interact with this environment. This proves static architectures brittle and calls for analytically rigorous approaches for ME. To that end, this paper proposes an intelligent mission coordination methodology that integrates digital mission models with Reinforcement Learning (RL), that specifically addresses the need for adaptive task allocation and reconfiguration. More specifically, we are leveraging a Digital Engineering (DE) based infrastructure that is composed of a high-fidelity digital mission model and agent-based simulation; and then we formulate the mission tactics management problem as a Markov Decision Process (MDP), and employ an RL agent trained via Proximal Policy Optimization. By leveraging the simulation as a sandbox, we map the system states to actions, refining the policy based on realized mission outcomes. The utility of the RL-based intelligent mission coordinator is demonstrated through an aerial firefighting case study. Our findings indicate that the RL-based intelligent mission coordinator not only surpasses baseline performance but also significantly reduces the variability in mission performance. Thus, this study serves as a proof of concept demonstrating that DE-enabled mission simulations combined with advanced analytical tools offer a mission-agnostic framework for improving ME practice; which can be extended to more complicated fleet design and selection problems in the future from a mission-first perspective.


翻译:随着系统工程目标从单体系统的设计与运行演变为复杂系统之系统的构建,任务工程这一学科应运而生,并日益被系统工程界接受为一种新的思维方式。此外,任务环境具有不确定性和动态性,任务结果直接取决于任务资产如何与环境交互。这证明静态架构具有脆弱性,并呼唤采用分析严谨的任务工程方法。为此,本文提出一种智能任务协调方法,将数字任务模型与强化学习相结合,专门应对自适应任务分配与重构的需求。具体而言,我们利用基于数字工程的基础设施,该设施由高保真数字任务模型和基于智能体的仿真组成;随后将任务战术管理问题建模为马尔可夫决策过程,并采用通过近端策略优化训练的强化学习智能体。通过将仿真作为沙箱环境,我们将系统状态映射为行动,并根据实现的任务结果优化策略。基于强化学习的智能任务协调器的效用通过空中消防案例研究得到验证。研究结果表明,基于强化学习的智能任务协调器不仅超越了基线性能,还显著降低了任务性能的波动性。因此,本研究作为概念验证,表明数字工程支持的任务仿真与先进分析工具相结合,为改进任务工程实践提供了一个与任务无关的框架;未来可从任务优先的视角,将该框架扩展至更复杂的编队设计与选择问题。

0
下载
关闭预览

相关内容

Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员