尽管空间计算在实现现代化优先事项方面发挥着重要作用,但《陆军现代化战略》并未充分涉及空间计算,而且研究的局限性直接影响了集成视觉增强系统等重大项目。
现代无所不在的技术,如智能手机、自动驾驶汽车和虚拟会议技术,都依赖于空间计算,但民用的适应和创新却超过了陆军的整合意愿和能力。
每项现代化和使能优先事项都依赖于空间计算技术,以实现所需的结果,如物体探测、空间测绘和用于自动或远程控制车辆的传感器融合。
2018 年,美国陆军向国会提交了《陆军现代化战略》(AMS)报告,确定了陆军六大物资现代化优先事项,并设想了 2035 年未来陆军的最终状态。为实现陆军现代化目标,时任陆军部长马克-埃斯佩尔宣布在得克萨斯州奥斯汀成立陆军未来司令部(AFC)。该现代化方法整合了条令、组织、训练、物资、领导发展与教育、人员、设施和政策(DOTMLPF-P)等要素,并在 AFC 内部调整跨职能团队(CFT),以压缩从能力差距识别到作战实验的采购时间表。本文认为,陆军在通过对空间计算研究的监督来实现其现代化使命的过程中存在风险,而空间计算研究涉及数字世界与物理世界的整合。因此,陆军应将空间计算研究列为其第十个优先研究领域,并分配更多资源以弥补 AMS 中这一看似被忽视的缺口。
当陆军展望 2035 年及以后的未来冲突时,其现代化战略概述了每个 CFT 的标志性工作。然而,在每个 CFT 努力朝着其标志性工作取得进展的同时,AMS 需要将空间计算纳入其中。在多领域环境中,冲突的数字和物理方面的界限变得越来越模糊,陆军必须齐心协力,投资于将这些环境融合在一起的技术研究。从未来合成训练环境中的眼球跟踪技术到未来自主战车中的物体探测,空间计算在军事技术整合中扮演着至关重要的角色;由于缺乏这方面的知识,一些标志性的工作(如陆军的增强现实护目镜)已经停滞不前。
"空间计算是"将涉及机器、人、物体及其所处环境的活动数字化,以实现并优化行动和互动"。该技术利用各种传感器,如光探测和测距(激光雷达)、雷达或摄影测量,生成周围区域的数字三维(3D)模型。空间计算在物联网技术和任何处理物理空间的技术中无处不在。自动驾驶汽车、智能手机和虚拟会议技术都建立在空间计算平台之上,使用户能够在其环境中无缝操作,并将其行为转化为数字世界。但陆军内部很少有人了解驱动空间计算的技术,也很少有人了解空间计算对陆军现代化的重要性。空间计算的四个关键组成部分是计算机视觉、传感器融合、空间映射和空间用户界面。
计算机视觉是计算机处理和分析来自与技术相关联的传感器和摄像头的视觉信息的能力。换句话说,它只是计算机观察和解释物理世界的能力。它可以在建立三维环境模型的同时,解读物体、人脸、运动和距离。计算机视觉的概念始于 1960 年,当时麻省理工学院的博士生拉里-罗伯茨(Larry Roberts)设想从二维(2D)视角提取三维几何信息。1982 年,戴维-马尔将计算机视觉定义为 "从二维视觉到三维视觉识别"。通过应用于二维图像的低级图像处理算法,马尔获得了二点五维草图,并利用高级技术获得了三维模型。如今,最普遍的计算机视觉应用出现在智能手机上,智能手机可根据面部特征识别和验证用户身份。设备可以生成用户面部的三维地图,并通过红外线和可见光与存储的数据进行匹配。
通过摄像头和传感器,如今的计算机可以拍摄环境图像,并对这些图像进行增强或处理,以提高算法的处理质量。图像处理后,识别图像中的特征点可降低图像的复杂性,简化匹配和识别过程。然后,计算机将图像中识别出的特征与其系统中的特征进行匹配,从而对其试图解释的场景做出估计。每个传感器和摄像头都在不断使用机器学习、深度学习和神经网络来分析和处理视觉数据。每个传感器都是整个模型的一部分,这就是传感器融合的作用所在。
三种计算机视觉技术是图像分类、物体检测和物体跟踪。图像分类涉及 "通过应用特定规则对图像中的像素和矢量组进行分类"。虽然图像分类是最著名的技术之一,但要解决与变形、光线设置和视角变化有关的问题,特别是在动态和非对称的陆军作战环境中,还需要研究进展。物体检测是计算机视觉的另一项技术;它 "使我们能够确定场景中所述物体的位置或移动,并用边界框绘制它们"。物体检测首先发生在物体跟踪过程中,然后通过深度学习应用进行;在所有这些过程中,计算机都要监控物体的运动模式。
传感器融合是一种软件算法(如卡尔曼滤波器或贝叶斯网络)将来自多种传感模式的数据合并在一起,以减少检测的不确定性,并增强独立运行的单个传感器的能力的过程。自动驾驶汽车是解释传感器融合的最佳背景。在自动驾驶车辆中,加速度计测量车辆的加速度,摄像头提供周围区域的图像,雷达、激光雷达和超声波传感器测量与物体的距离,GPS 使用卫星信号确定位置和速度。每个传感器都有各自的工作,但通过传感器融合可以整合每个传感器的数据。
传感器融合采用三种主要策略:高级融合(HLF)、低级融合(LLF)和中级融合(MLF)。HLF 涉及每个传感器在融合前进行独立的目标检测或跟踪,而 LLF 则在最低的抽象层次上整合每个传感器的原始数据。MLF 介于 HLF 和 LLF 之间,融合原始传感器数据中的多目标特征进行识别和分类。在 LLF 过程中,每个传感器的数据都在原始数据级别上进行了整合,从而有可能提高目标检测的准确性。不过,虽然 LLF 为最精确的目标检测提供了机会,但在实现传感器精确的外部校准和平衡系统在环境中的三维运动方面存在挑战,这表明在更广泛地实施 LLF 之前,还需要进行更多的研究。对深度学习和强化学习方法进行研究投资,以增强传感器融合算法并实现更可靠的物体检测,是未来发展的关键。
空间测绘是对物理环境进行感知和解读,以形成三维表象。通过立体视觉、飞行时间、结构光和激光雷达等技术,空间映射允许增强现实头盔等技术确定物体在周围环境中的位置。执行空间映射要求设备配备能捕捉周围环境几何形状和深度的传感器,同时配备能解释传感器数据(如云点或网格)的处理器。根据空间测绘的目的,设备可能还需要大量内存和存储能力来存储和更新三维模型数据。空间映射的一个普遍例子是苹果 iPhone 的 Face ID 技术,它使用摄像头传感器数据和激光雷达来创建用户面部的 3D 表示。通过将激光雷达的深度信息与摄像头获得的颜色和纹理信息相结合,iPhone 可以验证用户的身份(这就是为什么在 iPhone 前举着照片无法解锁的原因)。
用户在物理世界中与数字内容交互时,必须依赖空间用户界面。空间用户界面通常与虚拟现实或增强现实或两者的结合有关,最近被称为 "XR",即 "扩展现实"。与传统的数字设备相比,空间用户界面能让用户更加身临其境地与数字环境进行交互和操作。设备可以利用算法和传感器跟踪用户的动作、语音指令或肢体手势,并解读所需的功能。触觉反馈设备(如手套)可为用户提供额外的体验,让他们感受到数字环境中的互动。空间用户界面整合了眼球跟踪技术,以监测用户的视线,实现虚拟世界中的互动。例如,在苹果公司的 Vision Pro 中,高速摄像头和 LED 灯将不可见的光线图案投射到用户的眼睛上,实现直观输入。
计算机视觉、传感器融合、空间映射和空间用户界面相互配合,为用户提供了沉浸式的综合数字环境。然而,当前技术提供快速处理和精确解释的能力参差不齐。在陆军集中精力实施现代化战略的同时,必须解决技术差距问题,并强调技术的集成能够增强和改进陆军组织。民用公司需要更多的激励来增强空间测绘技术,以适应陆军的独特要求,例如在远程精确射击领域。这样一来,陆军就有责任投资于能为其现代化目标带来最可观红利的研究领域。
陆军现代化战略》于 2019 年发布,描述了到 2035 年陆军将如何转型为一支多领域部队。它概述了六个物资现代化优先事项和两个使能优先事项。六项物资现代化优先事项是
两个优先事项是
针对物资现代化的优先事项,AFC 建立了 CFT 框架,其中每个优先事项都有一个 CFT,专门负责在其领域实现多领域待命部队。每个 CFT 都确立了推进其领域的标志性工作,以支持陆军战略。空间计算的进步对士兵杀伤力和合成训练环境 CFT 的影响最为显著,但也带来了技术进步超过采用意愿的问题。
除了物资方面的努力,AMS 还概述了相关的变革性研究重点。遗憾的是,陆军优先研究领域中没有空间计算。虽然 "自主性 "可以支持自动驾驶车辆的目标,但它并不能充分满足防空与导弹防御 CFT 中物体探测或空间映射的需要,也不能满足士兵致命性 CFT 中增强现实系统对空间映射和传感器融合的要求。每个 CFT 都依赖于空间计算的一个方面,建立第十个陆军优先研究领域,集中研究空间计算,将快速推动每个 CFT 实现其材料目标。
远程精确射击仍然是陆军战术现代化的重中之重,但它在很大程度上依赖于空间计算技术的重大进步。AFC 远程精确射击 CFT 与陆军战斗能力发展司令部密切合作,建立支持 AMS 的原型系统。精确打击导弹和自主多域发射器是两个严重依赖空间计算的现代化平台。
更新后的精确打击导弹已进行了 499 公里的飞行测试,比当前的陆军战术导弹系统远 199 公里。目前的精确打击导弹已经证明了对静止目标的准确性,但陆军希望导弹能够打击移动目标。由于空间计算技术的限制,能够打击移动目标的最新型精确打击导弹目前还不是一种选择。导弹要打击静止目标,需要 GPS 坐标或惯性导航;只要掌握其中任何一种,导弹就能打击预先指定的目标。但对于移动目标,则需要雷达或红外寻的器。导弹可能会利用主动雷达寻的作为制导系统,以实现陆军所期望的反舰能力。在主动雷达寻的过程中,导弹包含一个雷达收发器,可以自主跟踪目标。主动雷达寻的导弹必须能够进行空间计算,如传感器融合和空间绘图。如果导弹使用红外线,则可能使用成像红外线(IIR),即红外线/紫外线传感器产生红外线图像。数码相机中的电荷耦合器件的功能与此基本相同。导弹需要具备快速进行传感器融合计算的能力,以便在飞行中进行调整并准确打击目标。随着干扰和导弹防御技术的不断进步,导弹进行快速空间测绘计算的必要性也在增加。要实现陆军所期望的反舰能力精确打击导弹的终极目标,必须取得空间计算方面的进步,以确保这种能力适合于相对较小的远程导弹封装。
陆军的自主多域发射器(AMDL)为空间计算研究的必要性提供了最明显的例子。该飞行器是一种无人驾驶发射器,可执行自主航点导航,并允许领导者-跟随者自主或线控操作。该飞行器将传感器与它的单路和三路态势感知摄像机、全球定位系统、激光雷达传感器、自主转向模块、盲点雷达和摄像机以及与定位导航单元融合在一起。AMDL 将面临与主要民用汽车公司相同的所有空间计算问题,缺点是车辆需要空间计算能力,以便在车载计算机可能没有预先绘制地图的地区进行越野导航。民用车辆可能只需进行二维物体探测即可,而运载导弹的重型军用车辆则需要进行三维物体探测,并能够快速绘制环境地图以探测移动物体。
陆军的下一代战车计划主要集中在四种战车变型上,而机器人战车(RCV)计划则完全依靠空间计算技术的进步来解决地面自主导航问题。RCV 将作为一种可半自动运行或由操作员远程控制的战车。RCV 计划有三种变体:重量在 10 吨以下的轻型变体(RCV-L)、重量在 10 至 20 吨之间的中型变体(RCV-M)和重量在 20 至 30 吨之间的重型变体(RCV-H)。每个平台都集成了机载直射武器系统。固定翼飞机可以运输所有型号,旋转翼飞机可以运输 RCV-L。
RCV 项目面临着与 AMDL 类似的问题,即带有车载武器的军用车辆必须完成连民用车辆都难以完成的任务。在美国国内,自动驾驶汽车目前处于美国汽车工程师学会(SAE)六级中的第二级,这意味着车辆可以独立转向、加速和制动,但要实现整体功能,仍需要驾驶员的参与。RCV 提议取消驾驶员,将车辆置于一个动态战术环境中,该环境中存在非对称威胁和未绘制地图的地形。该车需要快速精确的空间测绘技术和全面的传感器融合能力。远程操作员的额外集成意味着车辆必须有一个可用的界面,以便在完全测绘的环境中与操作员进行通信。实质上,飞行器本身将成为人机交互的一部分。
AFC 的未来垂直升降(FVL)CFT 专注于满足 AMS 概述的航空空间现代化需求。未来战术无人驾驶飞机系统 (FTUAS) 就是空间计算研究必须转化为航空空间的一个例子。与 "远程精确射击 "和 "下一代战车 "研究小组开发的自主无人飞行器一样,FTUAS 依赖于计算机视觉、空间映射和传感器融合等空间计算概念。它依靠光电/红外(EO/IR)传感器、红外/激光指示器/激光测距仪、车载照相机和传感器的传感器融合过程,以自主或遥控方式运行。
与陆军正在研发的其他自主飞行器一样,FTUAS 也必须克服几个研究和技术障碍,才能在全军推广。首先,该飞行器需要先进而强大的物体探测功能,以及解读周围环境的能力。如果要有助于支持作战行动,它还需要具备在各种天气和光线条件下工作的能力。它不仅要能不受损坏地导航到目标区域,还要能识别潜在的敌方战斗人员,并利用配备的有效载荷。如果 FTUAS 要在自主模式下运行,还需要能够对意外遭遇做出精确反应。由于无法提前预测每种情况,动态作战环境需要的不仅仅是基于规则的编程。因此,我们需要能够准确描述环境并根据需要进行调整的机载系统。考虑到 FTUAS 很可能没有预先加载详细的作战区域地图,因此飞行器必须具备准确的定位算法,并能绘制周围环境地图。
AFC 的网络 CFT 有四项主要标志性工作: 统一网络、指挥所共同环境、联合互操作性/联盟可访问性和指挥所移动性/可生存性。虽然空间计算在网络 CFT 中没有明显的直接作用,但它很可能在战术网络试验台(TNT)中发挥着第三级作用。TNT 可以评估军事或战术通信网络的性能、可靠性和安全性。通过检查网络的带宽利用率、响应速度、加密能力和弹性,单元可以评估网络有效进行数据传输、支持通信和协调军事单元的能力。随着陆军越来越多地依靠自主和半自主车辆来支持作战行动,评估数据传输速率、延迟和无线通信性能的能力对于任务的成功至关重要。此外,由于先进技术利用传感器和摄像头执行空间测绘和计算机视觉协议,因此保护所生成数据的安全至关重要,而 TNT 的应用为测试和改进安全措施提供了受控环境。
AFC 内的防空和导弹防御 CFT 一直在开展各种项目,包括陆军综合防空和导弹防御 (AIAMD) 及其物资解决方案,即综合防空和导弹防御作战指挥系统 (IBCS);机动短程防空 (M-SHORAD);综合火力保护能力 (IFPC);以及下层防空和导弹防御传感器 (LTAMDS)。AMD CFT 开发的所有防空和导弹防御系统都集成了先进的目标探测能力,这在民用领域是难以比拟的。这些系统需要独特的传感器融合能力,为指挥员绘制单一的防空图景,并且必须同时解释传感器、武器和任务式指挥系统。目前的技术限制表明,传感器融合的速度必须与作战速度相称。
美国空军司令部内的 "可靠定位、导航和定时/空间 CFT "致力于三项标志性工作,其中之一是 "战术空间层"(TSL)。战术空间层通过传感器融合将来自各种传感器的数据整合在一起,以建立关于地面物体位置和移动情况的实时数据。指挥官可以利用 TSL 提供的数据为战术决策提供信息,并形成更全面的战场意识。TSL 将与战术情报目标定位接入节点集成,接入空中和地面传感器,同时确保接入国家和商业传感器。如此多的传感器同时快速地集成在一起,提出了传感器融合程度如何才能提供实时战场画面的问题。由于数据输入来源广泛,在原始数据层面进行低层次的融合具有挑战性,但却能提供更准确的战场图像。
士兵杀伤力 CFT 的集成视觉增强系统 (IVAS) 标志性工作完全依赖于该系统精确集成所有空间计算组件的能力。IVAS 是微软公司正在为陆军开发的一款增强现实耳机,通过整合空间用户界面和创建叠加传感器信息,确保士兵拥有更强的作战知识,从而提高士兵的态势感知能力。当前版本的IVAS遇到了一个名为 "动态遮挡限制 "的空间映射问题,即该设备无法复制物理对象如何遮挡虚拟对象的视图。空间映射限制严重干扰了 IVAS 的生产和分发,目前还没有解决这一问题的办法。2023 年 1 月发布的 IVAS 性能报告批评 IVAS 存在诸多技术困难。要在作战环境中为士兵成功实施增强现实护目镜,就必须在作战训练环境门槛以下积极使用。及早采用并将其纳入《部队领导程序》,以便进行有力的演练和全面的命令制 作,将确保在作战环境中采用时需要克服的障碍更少。
AFC 内的合成训练环境 CFT 主要集中在五项标志性工作上: 合成训练环境信息系统、可重新配置的虚拟集体训练器、班组沉浸式虚拟训练器、班组/士兵虚拟训练器和 "一个世界的地形"。合成训练环境的建立在很大程度上依赖于空间计算技术的进步,因为数字世界需要逼真地再现物理世界,同时建立一个可用的空间用户界面。无论使用何种平台整合合成训练环境,系统都必须能够为士兵提供逼真训练所需的全面范围。陆军的 "同一世界地形 "计划力求在陆军网络内提供一个完全可访问的物理地球虚拟表示。要实现对地球的完整虚拟呈现,数字环境就必须在现有 3D 图层的基础上进行扩展,并整合精确的空间测绘技术,转换物理世界的内容,确保将其转换为数字环境中的高分辨率呈现。
正如 AMS 所概述的那样,陆军正在努力实现到 2035 年向多领域部队的转型,但在实施过程中也面临着各种障碍。由于无法解决复杂的空间计算问题,例如综合视觉增强系统的开发中断,陆军航空兵 CFT 的标志性工作面临着难以逾越的障碍。随着自主和半自主战车研发和生产的不断扩大,我们需要协同努力,了解并解决任务集所特有的问题。随着陆军向现代化目标过渡,物理领域和数字领域将继续变得模糊,能否解决开发合成训练环境和增强现实作战支援工具所固有的复杂空间用户界面问题,将对陆军在全球力量竞争中的适应能力和竞争能力起到决定性作用。因此,陆军必须扩大其研究重点,集中精力研究空间计算的各个方面,以确保在努力实现能够多域作战的现代化陆军的过程中取得成功。