“蜂群之路”:利用人工智能训练无人机

2018 年 9 月 28 日 无人机

 


据“战争困境”网9月21日报道,大自然蜂群的法则可以用来控制廉价无人机机群,众多的个体可以完成巨大而复杂的任务。到目前为止,开发人员主要集中在管理蜂群,而实际上分散的群体更具有弹性,因为集中执行任务会带来脆弱性,在邻近对手的敌对竞争环境中可能会出现问题。


美军飞行员克莱顿•舒特和卢卡斯·威尔两位少校发表在该网站的文章称,“作为两名空军军官,我们最近观看了空军官方视频的一个假想场景,其中一架F-35与一组无人机合作深入打击战略目标的使命。我们想知道如果出现动态威胁将会发生什么,迫使人们偏离预先计划好的飞行路径,要求飞行员对每架无人机的决策进行微观管理。”在这种情况下,情况的速度、范围和复杂性将使飞行员不堪重负。尽管F-35拥有一支强大的无人机团队,但关键的教训是,无人机的数量众多并不等于真正的无人机蜂群。


响应性控制蜂群超出了人类认知能力


 对于空军而言,在战斗中部署大量无人机并不具有决定性作用。部队必须首先弄清楚如何执行无人机的任务,并重新平衡无人机群的任务量。正如海军陆战队作战实验室最近的一份报告所示,响应性控制无人机蜂群超出了人类的认知能力。相反,每架无人机必须能够执行整个群体的基本特征,即独立协调自己的决策以产生支持集体目标的行为。因此,为了有效地发挥无人机群作用,人们必须将更多的自主权交由系统的集体算法决策。



文章认为人工智能和战争游戏不仅可以用来训练人员,还可以用来训练无人机。“雅典娜”(Athena)是个战争游戏平台,用于测试人工智能功能,捕获和评估结果数据,以改善军事训练。通过使用AI来完成数百万次特定战争游戏任务的迭代,该框架揭示了人机交互的最佳规则,这些规则推动了支持特定任务的集群行为。这种“集群方式”提供了快速、高度灵活和不断适应变化的方法,并且可以专注于特定任务,同时帮助单个无人机以分散的方式运行,以服务于编队任务。


专注于特定的人工智能


在描述“Athena”的文章中,本杰明·詹森、斯科特·科莫和克里斯·怀特认为,与其等待人工智能的革命,还不如专注于特定的人工智能的成就,就执行特定任务而言,为解决特定军事问题提供更直接的机会。文章称:“战争游戏提供了探索如何将AI与指挥官操作判断相结合的最佳平台。......战争游戏Athena提供了一种方法,可以为将来的测试建立数据存储库,增强对AI如协助培训,对红队和仿真的理解,并强调这些功能在与人类交互时的极限环境有不确定性。”


Athena框架将传统战争游戏与狭义人工智能相结合,可以通过加强指挥官的作战和战术决策过程来提高训练的质量。此外,该框架可应用于训练无人机。融入战争游戏平台的人工智能提供了一种快速训练、质量决策算法的方法,以满足空军对无人机和忠诚僚机不断增长的需求。


随着战争特征的变化,无人机群算法的快速,灵活和任务特定的训练计划将变得至关重要。人工智能和无人机等商用技术的融合,正在将战争推如到下一个演变中,任何部队现在都可以将一个无人机蜂群部署到战斗中。鉴于各国之间长期战略竞争的兴起以及他们对人工智能和自主性武器的投资,找出如何利用集群,而且如何防御集群,对于竞争战略至关重要。


具有决定性作用的并非都是硬件



“数量具有自己的品质。”——约瑟夫•斯大林


就空中优势而言,数量上的缺点会使部队的质量显得无关紧要。在第二次世界大战中,俄罗斯军队用数量重挫东部战线的德国空军。太平洋地区的日本空军与此相近:虽然日本飞行员最初训练有素,但很快就难以对抗数量带来的有效竞争优势。当两支假想部队数量相匹敌,质量将最终胜出。拥有相同数量的无人机将不再是决定性的。此外,在现今的机群中,额外的无人机将增加人类控制的工作量,最终减少到无法部署更多的群体。在此情况下,成功将取决于机群的质量,而不是数量。


然而,质量在这种背景下意味着什么?纵观历史,通常在战斗中具有决定性作用的并非都是硬件,而是人类在操作技术方面的表现。对军事训练的研究发现,人类通常是武器系统战斗力的限制因素,导致整个部队的训练计划发生革命。在越南战争期间,海军实施了Top Gun,这是一项针对其飞行员的严格训练计划,有助于将空对空杀伤率从二比一增加到十二比一。在越南之后,空军和陆军都从海军的成功中吸取了教训,并建立了大型部队演习,如红旗和国家训练中心,为其操作员提供额外的严格训练周期。


除了观察士兵如何训练外,军方开始关注优化人的决策过程。空军训练机组人员实施博伊德(John Boyd)上校的开创性模型,通过观察环境的反馈循环,定位可能的解决方案,根据有限的信息做出决定,并采取行动以达到预期的效果,加速决策过程(OODA环)。


“永远不要告诉人们如何做事。告诉他们要做什么,他们的聪明才智会让你大吃一惊。”——乔治•巴顿将军


大规模的部队训练有助于增强其集中控制和分散执行任务的理论。随着战斗规模、范围和复杂性的增加,这一概念成为空军“战争方式”的基本原则之一。这些部队现在使用术语任务命令来体现战争中分散执行任务的重要性。


在处理集群自主性武器时,严格的培训、更快的决策和分散的执行仍将是至关重要的。研究人员认为,自主性系统质量的决定性因素将是硬件内部的OODA循环算法,需要对这些算法进行训练,以便武器系统知道该做什么。简而言之,训练人类将不再适用; 相反,训练算法将变得越来越重要。质量算法将在战术环境中实现更大的灵活性,并允许以前所未有的规模来分散执行。因此,需要快速训练算法在人与自治系统之间建立信任和信心的战略框架 。


战略框架应结合人工智能


DARPA的进攻性群体战术(OFFSET)计划用于训练成群自主性系统。OFFSET建议使用实时游戏环境和虚拟现实界面,以允许用户通过“众包”方法为自主性系统推导出新颖的群体策略。通过使用特定任务的游戏来训练,测试和使用群集功能(而不是根据任务定制的蜂群活动),OFFSET框架显现出重大的希望。


克莱顿和卢卡斯少校认为,“我们预见OFFSET会带来三个弱点。”首先,随着时间的推移,依靠众包努力来试验游戏可能很难维持。随着项目中的兴趣(和资金)消退和流动,“人群”的规模可能无法持续。其次,随着不同的硬件和环境准备好进行测试,众包方法在培训中迅速重复变得麻烦。第三,OFFSET太慢了。它强调了训练群体的实时模拟环境,无人机通过战斗空间“点击”移动。这种方法降低了群体在操作中的速度和主动性,并且使得难以加速重复以在几分钟或几秒内通过数千种潜在的战术场景训练无人机。


然而,将OFFSET现有的框架与AI相结合,可以产生一种能快速灵活适应各种任务的新型框架。2017年,谷歌的Deep Mind在应用类似的“自我发挥”训练框架(即强化机器学习)来生成一种掌握中国游戏Go的算法时感到惊讶。谷歌的人工智能能够在短短几天内积累数千年的人类知识,这只能通过比实时更快的模拟来实现。将谷歌在人工智能方面取得的突破与特定任务的战争游戏相结合,提供了一种强大的方式来训练和战斗成群的无人机。


例如,人工智能可以发挥战争游戏模拟高层决策、行动、互动,以及为一群负责保卫基地的空中无人机产生的行为。AI不是求解集中式解决方案来管理整个防御群的位置,而是迭代地发现个体交互的最佳规则,而这些规则相结合产生集体群体行为,最大限度地减少攻击力造成的基础伤害。最终,由此产生的“AI训练的”本地交互规则被加载到蜂群中的每架无人机中,准备执行特定的基本防御任务。优化的本地无人机交互规则可实现自组织和分散,从而减少人员监督以执行特定任务。


这一拟议的空军“集群方式”解决了当前无人机训练框架的弱点。首先,它的执行速度很快,并且避免了众包的不稳定性。无人机操控员的工作负载需求被人工智能算法和云计算的持续可用性所取代。其次,狭义AI和战争游戏都将具有高度的灵活性,能够适应不断变化的游戏假设,例如新的硬件或环境条件。如果新的传感器可用,无人机则可以更好地监测对手,框架可以快速重新运行。第三,该框架继续应用使用任务来确定能力的原则,通过解决保持分散执行原则的本地无人机交互规则来实现这一原则。


挑战:没有人真正知道最先进的算法是如何做到的 


结合高保真战争游戏和狭义人工智能需要融合私营部门和军事专家。不幸的是,围绕这种关系的摩擦已经发生,近4000名谷歌员工要求终止他们公司对国防部Project Maven的支持。该项目使用狭义的人工智能减少人工负担并最大限度地减少非战斗人员的伤亡,旨在通过帮助军事分析人员更好地处理、利用和传播大量收集的情报,监视和侦察数据。


此外,没有人真正知道最先进的算法是如何做到的。当使用狭义AI时,存在“黑匣子”现象的风险,即由于所使用的机器学习技术的复杂性而无法对算法做出的决定进行简单解释时,会发生这种情况。最终,军方必须在其承担的风险方面进行权衡。


“除非敌人说一切都结束了,否则战争不会结束。我们可能会想一想,我们可以宣布结束,但事实上,敌人是有投票权的。”——美国国防部长吉姆·马蒂斯


有质疑者认为蜂群可能“在到达时就完蛋”。首先,这些批评者指出,无人机可能不如那些倡导技术的人宣称的那么便宜。但是,虽然我们承认武装无人机在这一点上可能成本过高,但商业上可用的系统如“大疆”Mavic 2(美国士兵在最近的禁令中广泛使用),足够便宜(每架大约1000美元),便于保障蜂群数量的优势。其次,怀疑论者声称,实现无人机蜂群的信息技术将使对手能够部署廉价有效的防空来打败他们。虽然有证据支持这一说法,但历史提醒我们,即使最好的防空也不完美。例如,斯坦利·鲍德温在1932年宣布“轰炸机将永远通过”防空在第二次世界大战期间被证明是真的,条件是轰炸机部队愿意承受高伤亡。成本低廉的自主性无人机本质上降低了高伤亡的风险。因此,尽管防空技术先进,但只要数量足够多,无人机蜂群总能通过。


最后,一些反对者认为,基于计算机的战争游戏模型会在理论与现实之间产生差距,因为它们无法捕捉人类的动机,如欲望、承诺、激情或意志。虽然这些批评有一定道理,但它也取决于战争游戏的预期用途:战争游戏越具体,模特就越具代表性。此外,使用现场测试等其他方法验证战争游戏可以增强其预测效用,并缩小模拟与现实之间的差距。在现场测试蜂群的情况下,数据可以反馈到AI和战争游戏框架中,以在后续操作中生成更精准的行为。


容易忽略的关键:培训蜂群分头执行任务


美国军方已经认识到军事硬件的成本上升以及服役人员的数量相应减少。军方试图通过投资大量廉价系统(如无人机蜂群)来扭转这一趋势,但却忽略了一个关键因素:如何训练蜂群。为了充分利用蜂群的潜力,空军必须在人类自主性系统中建立信任,并培训蜂群分头执行任务。


据称,美国空军“蜂群方式”有望成为其即将推出的自主系统机群训练策略。狭义AI融入战争游戏提供了一种快速、灵活和自适应的方式来发现和体现集群行为的最佳交互规则,这可以通过减轻人的负担来增强自主性系统。如果不将更多自主行动权交付给蜂群系统,未来作战环境的速度、范围和复杂性权将远超过人类所能驾驭。展望未来,空军无人机机群使用最优质的人机结合算法训练,将有助于保持有竞争力的空中优势。

作者丨远望智库技术预警中心  乐天

转自丨装备参考


点击下面链接 查看历史文章


贝尔展示V-247无人攻击机全新模型

当前世界主要反无人机方案及技术发展综述

八一八:什么是植保无人机专用电池

无人机:AIRBUS的天空蓝图

向死而生 | 高精度测绘的新市场机会

号称无人机操作系统的Airware倒闭


登录查看更多
2

相关内容

不需要驾驶员登机驾驶的各式遥控飞行器。
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
12+阅读 · 2020年4月28日
专知会员服务
44+阅读 · 2020年3月6日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
美国会听证会展示人工智能发展现状及趋势
新智元
5+阅读 · 2019年3月17日
【工业4.0】工业人工智能与工业4.0 制造
产业智能官
18+阅读 · 2018年11月8日
无人机集群、蜂群与蜂群算法
无人机
89+阅读 · 2018年9月25日
【无人机】无人机的自主与智能控制
产业智能官
46+阅读 · 2017年11月27日
Arxiv
15+阅读 · 2018年4月3日
Arxiv
7+阅读 · 2018年2月26日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员