快速准确地识别附近的飞机对美国海军舰艇的安全有效运行至关重要。现代技术和计算机辅助决策工具为过时的战斗识别方法提供了替代方案。通过将 Soar 认知架构的强化学习功能与战斗识别技术相结合,本论文探索了两者合作的潜力。在开发出 Soar 与战斗识别方法之间的基本接口后,本论文分析了所开发的 Soar 代理对既定真理的整体正确性,以确定系统的学习水平。虽然这项初步研究的范围有限,但其结果有利于战斗识别的大幅现代化。除了建立概念验证外,这些发现还有助于未来的研究,以开发出一个强大的系统,能够模仿和/或辅助人类操作员的决策能力。虽然这项研究的重点是基于海上的海军应用,但研究结果也可扩展到整个国防部门的实施。
战术决策者可获得的海量信息会让战术行动官(TAO)或任务指挥官(MC)等单个操作人员应接不暇。在作战环境中,战术行动官或任务指挥官必须快速正确地识别和分类未知飞机(海军作战部长 [CNO],2012 年)。随着未知飞机数量的增加,传感器数据和决策信息的数量也相应增加。通过尝试确定一种有助于 TAO/MC 决策过程的程序,有可能提高操作员的效率,从而通过减少飞机在战斗识别(CID)方面未分类的时间来提高作战环境的内在安全性。通过强化学习(RL)解决方案,Soar: 认知架构可促进 CID,并最终模拟 TAO/MC 的认知过程。
本论文是解决 TAO/MC 决策者可能遇到的 CID 操作员任务超负荷问题的关键一步,它通过有效(准确)的 RL 确定了模拟 CID 过程的计算机辅助决策工具。通过评估 RL 对简化的 CID 规则集的影响,可以评估 Soar 认知架构,将其作为一个合理的框架纳入 TAO/MC 职责。最终,评估 RL 功能是否足以成为在特定行动领域内准确模拟 CID TAO/MC 认知功能的工具集,对于在扩展研究之前证明这一概念的可行性至关重要。研究 RL 的潜在益处可以重塑 CID 的标准操作程序和 TAO/MC 的主要职责。
结合 CID 评估 RL 算法是研究确定合作系统可行性的关键一步。本论文将利用 SOAR 认知架构和基本的 CID 矩阵,尝试回答以下研究问题: “在 SOAR 认知架构下,CID 的强化学习是否有效?
对上述研究问题的评估将通过开发和分析两个以结果为导向的假设来实现。
假设 Ia. 将强化学习/奖励价值纳入战斗识别功能将降低或不改变所提供的建议行动/识别的有效性。
假设 Ib. 将强化学习/奖励价值纳入战斗识别功能将提高所建议行动/识别的有效性。