任务规划涉及将离散资产分配给优先目标,包括在复杂的环境条件下将这些资产动态路由到目的地。由于快速周转的价值和模拟作战环境的相对简单性,人们非常有兴趣通过添加人工智能 (AI) 的强化学习技术来改进任务规划过程,这可以产生更好、更快或只是人类考虑的独特解决方案。本报告描述了如何使用人工智能进行任务规划,以及人工智能方法与更传统的运筹学 (OR) 方法的比较。
任务规划涉及将离散资产分配给优先目标,包括在复杂的环境条件下将这些资产动态路由到目的地。由于快速周转的价值和模拟作战环境的相对简单性,人们非常有兴趣通过添加人工智能 (AI) 的强化学习技术来改进任务规划过程,这可以产生更好、更快或只是人类考虑的独特解决方案。本报告描述了如何使用人工智能进行任务规划,以及人工智能方法与更传统的运筹学 (OR) 方法的比较。
本报告是五卷系列中的第五卷,探讨了如何利用人工智能在四个不同领域协助作战人员:网络安全、预测性维护、兵棋推演和任务规划。本报告主要针对那些对任务规划、运筹学和人工智能应用感兴趣的人。
研究问题
- 如何在任务规划过程中使用人工智能?
- 应用于任务规划的人工智能方式方法与传统的 OR 方式方法相比有何不同?
- 人工智能是否可以改善任务规划过程中的特定角色或任务?
- 在任务规划过程中应用人工智能有哪些要求?
关键发现
- 与 OR 方法相比,人工智能的性能通常更差。考虑到OR涉及解决摆好姿势的优化问题,这一结果并不奇怪。不过,人工智能可以更稳健,更能应对不断变化的环境,因为 OR 解决方案只是为了解决静态问题。
- 人工智能能够在某些规划任务中提供帮助,以这种方式使用人工智能将为未来人工智能的使用积累能力、经验和用户信任。任务路线规划是人工智能应用范围较窄的一个例子,尤其适用于动态威胁环境,在这种环境中,任务包进入复杂的防空环境,面临突如其来的威胁。
- 用于任务规划的人工智能需要开发基础设施,将模拟环境与人工智能框架有效连接起来,而人工智能框架通常是用不同的编码语言编写的。幸运的是,这对每个模拟环境来说都是一次性投资。DAF 应考虑此类投资,并向政府和伙伴组织发布基础设施。
- 在任务规划和更广泛的战争中实施人工智能不仅仅是创建一个独立项目的问题。关键是要支持与其他工具的连接,并随着新工具的发明不断更新这些连接。如果没有这种持续的支持和努力,人工智能的实际使用将不可避免地落后于近邻对手。
建议
- DAF 应将强化学习(RL)任务规划应用于无人驾驶系统的动态路线规划,由操作员进行审查和判断。目前,强化学习在任务规划中的最佳应用是作为快速反应管理系统,对威胁做出动态响应。这既适用于机载无人机,也适用于能在数秒而非数分钟内提供最新飞行计划的总部。即使 RL 提供的是次优计划,它也能建议立即采取行动;操作员可以利用快速反应所赢得的时间,采用当前的标准和首选方法制定更好的计划。
- DAF 应该培训对军事任务规划有深刻理解的人工智能专家。RL 是一个依赖经验和启发式方法的困难研究领域。由于需要特定的应用知识,研究工作变得更加复杂。对该领域缺乏了解的人可能无法识别不良状态和行为,从而无法设计出合适的奖励函数。
- DAF 必须优先考虑工具和软件,不仅要创建工具和软件,还要使这些资源具有可扩展性并可与现有系统连接。应扩展现有的模拟工具,使其与人工智能框架兼容。
- DAF 应持续监测人工智能 RL 的发展状况。虽然人工智能在商业和研究领域发展迅速,但 DAF 仍需保持警惕,寻找机会整合新的进展。