现代硬件系统依靠状态估计器(如卡尔曼滤波器)来监测关键变量以进行反馈和性能监测。硬件系统的性能可以用卡方故障检测测试来监测。以前的工作表明,卡尔曼滤波器很容易受到虚假数据注入攻击。在虚假数据注入攻击中,故意在传感器测量数据中加入噪声和/或偏差,以误导卡尔曼滤波器,而这种误导方式不会被卡方测试所发现。本论文提出了一种欺骗卡尔曼滤波器的方法,其中攻击数据是用强化学习产生的。研究表明,强化学习可以用来训练一个智能体,通过注入虚假数据来操纵卡尔曼滤波的输出,而不被卡方检验所发现。这一结果表明,机器学习可以被用来成功地进行网络物理攻击,而行为者不需要对支配目标系统运行的数学有深入的了解和认识。这一结果对现实世界有重大影响,因为现代智能电网、飞机、汽车和航天器控制系统都是网络物理系统,它们依靠可信的传感器数据来安全和可靠地运行。针对这些系统中的任何一个的机器学习衍生的虚假数据注入攻击都可能导致未被发现的、可能是灾难性的故障。
第1章概述了所进行的研究,描述了卡尔曼滤波、chi-squared测试和网络物理系统之间的关系。第2章提供了关于卡尔曼滤波器chi-squared故障检测和本研究中使用的RL方法的支持信息。第3章描述了用于建立CPS模型的方法,详细描述了RL算法,并涵盖了对算法功能的测试和验证。第4章介绍了研究的结果。第5章详细介绍了结论和未来的研究领域和适用性。