装备有成像传感器的卫星是情报、监视和侦察(ISR)任务的关键资产。然而,从这些资产的任务中可能获得的巨大数据量很快就会让人类无法完整地人工考虑。正是由于这个原因,分析卫星图像的自动化系统对于帮助人类分析员从卫星图像中提取可操作的信息至关重要。
最有前途的自动化工具之一是机器学习(ML)。在一些收集背景下,如医学成像[17]和自主车辆的视觉[21],ML在从图像中做出准确推断方面已经显示出巨大的成功。因此,有理由认为,在其他采集环境中获得成功的机器学习模型和方法也可以用于从高空拍摄的图像。事实上,在使用机器学习对卫星图像进行准确推断方面,已经有了许多公开的成功案例。从人道主义和救灾[57]到农业规划[13]等问题领域都受益于基于ML的计算机视觉系统。
在卫星图像上使用机器学习的效用促使了系统的发展,该系统将机器学习模型作为分析员工作流程的核心组成部分。本文的目标是为开发此类模型提供一小部分必要的实践指导。调查目前关于这个主题的知识并将其提炼成实用的指导是一项艰巨的任务。为了提供一个更有针对性的指导,我们以多种方式确定这项工作的范围。我们专注于目标检测--在图像中定位目标的位置,以及它们属于哪一类目标的抽象任务。我们选择这个问题的原因有很多。首先,许多ISR任务可以被设定为目标检测任务。例如,从卫星图像中检测特定的陆地车辆、海船、设备和人都可以被设定为目标检测任务。即使ISR任务要求对目标进行更复杂的推理,许多目标探测的原则也适用。其次,目标检测是现代机器学习在图像领域中比较成熟的领域之一。因此,为了建立准确的目标检测模型,有大量的前期工作可以借鉴。
我们还将这项工作的重点放在目标检测模型(或目标检测器)的评估上。也就是说,我们的重点是:1)评估目标检测器的重要特征样本;2)评估目标检测器的常用指标样本;3)如何识别和定义重要用例的评估标准;以及4)如何将目标检测器的特征和用例映射到指标上,以便以具体、可衡量的方式评估目标检测器。因为评估自然发生在数据收集和探测器学习之后,所以我们也必须触及与这两个主题相关的细节。我们的目标不是要对这些主题进行全面的处理。相反,我们的目标是提供基本信息,作为了解设计、学习和评估目标检测器时的一些独特考虑因素的手段,并辅以参考文献,让读者有途径进行更深入的探索。
本指南的其余部分将按以下方式进行。在第2章中,我们定义了目标检测问题,讨论了学习目标检测模型的现代方法,并提供了一些对卫星图像的的实际见解。在第3章中,我们讨论了评估目标检测器的做法,包括方法、指标,以及如何将其映射到检测器性能的有意义的概念。在第4章中,我们通过展示对航空图像的目标检测模型的评估结果,展示了这些主题的一些实践。最后,在第5章中,我们总结了文件中所探讨的实际见解,并对目标检测中的开放课题进行了简要调查。
图 2.2:图像示例,标注有边界框(图片来源:RarePlanes Data Set [61])。例如,右上角的目标被标记为“军事战斗机/拦截器/攻击”类的成员。目标的位置由边界框的左上角 (x1, y1) 和右下角 (x2, y2) 坐标定义。
图 4.2:来自 RarePlanes 数据集的示例。顶部图像 = 标记为边界框的地面实况。中间图像 = RetinaNet 的输出。底部图像 = Faster R-CNN 的输出。