强化学习(RL)是机器学习的一个分支,应用于从机器人到自然语言处理、从游戏技术到医疗领域和金融等多个领域。它被广泛应用于包含大量数据的系统中,在这些系统中,瞬时数据流非常密集,数据标记非常困难或根本不可能。RL 是探索新策略或组合的首选方法,因为其对现实生活中的控制问题非常方便,而在这些问题中,顺序决策至关重要。在 RL 发展的早期阶段,主要应用于游戏技术。然而,最近 RL 的应用已经多样化,并扩展到大量新领域。作为土耳其领先的国防工业软件和仿真公司 HAVELSAN,对该技术进行了投资,以获取其引人注目的优势。在本研究中,将详细阐述强化学习技术的基本原理,并根据现有的研究成果重点介绍其新型应用和未来预测。然后,从仿真技术的角度具体介绍了强化学习技术,并介绍了HAVELSAN的 FIVE-ML 项目,该项目旨在从基于规则的行为建模过渡到基于学习的智能行为建模,以提供更有效、更动态的飞行员培训环境。
HAVELSAN公司是一家土耳其领先的系统集成商公司,在国防、安全和信息学领域拥有先进技术的软件密集型原创解决方案和产品,不仅在指挥控制系统、国家安全和网络安全及信息技术方面,还积极研究机器学习、人工智能等新兴技术、增强现实和创新模拟技术。
为此,其仿真、自主和平台管理技术部门在许多领域生产高质量的民用和军用航空飞行模拟器、训练辅助工具、决策支持系统和兵棋推演系统。此外,还开展了机器人系统无人驾驶陆地车辆的生产等研究。虚拟环境中的部队(FIVE)产品是HAVELSAN公司生产的仿真软件产品之一,它可以模拟虚拟陆海空平台的行为,这些平台可以执行作战平台模拟器战术训练所需的防御和进攻任务。因此,它为模拟器提供了必要的战术环境。有了 FIVE,模拟器用户就可以在安全的环境中,使用各种作战装备(如武器、传感器、反导系统、电子战、通信和链路系统等),无风险、低成本地进行综合战术和作战训练。目前已在努力使这一基于自主规则的软件以基于学习的人工智能为基础。
虚拟环境中的部队(FIVE-ML)项目的人工智能方法是在监督学习等其他机器学习策略的支持下,在仿真技术领域使用 RL 实现的。随着HAVELSAN公司开发的 FIVE 软件产品基于规则的自主行为结构的发展,以及向使用 RL 学习的人工智能基础设施的过渡,已经取得了具有成本效益的成果,与市场上的同类产品有所不同。有效的解决方案使许多此类产品的质量更高,并能满足使用新技术时可能出现的需求。在本研究中,将解释 RL 技术,并研究其在各个领域的应用。将从已考察过的研究和现状出发,对未来进行预测。