目标检测是用于军事应用的计算机视觉的最流行领域之一。在这种情况下,目标检测模型的使用方式之一是用于战场上的实时目标识别。许多这些模型开始被纳入士兵使用的技术中(即无人驾驶地面车辆和平视显示器),以帮助他们识别周围可能代表对其安全的潜在威胁的目标。通过正确检测和分类战场上的危险目标,这些模型能够为士兵提供关于他们周围环境的有用信息,以便他们能够就如何进行任务做出决定。
目前的目标检测模型出现的一个主要问题是,它们难以检测到只有部分可见或被遮挡的目标。在这些情况下,目标探测模型往往根本无法探测到这些目标。它们也可能检测到部分被遮挡的目标,但却用错误的目标类别对它们进行分类。遮挡是许多研究人员在开发和训练他们的目标检测模型时没有考虑的一个条件,尽管它在现实世界中很常见。为了确保士兵的安全,以及改善未来目标检测模型的状况,有必要确定当前的目标检测模型在面对这种情况时的工作情况。
这项工作的主要目的是对三种最先进的目标检测模型进行基线评估,这些模型是在一个包含许多部分遮挡目标的流行目标识别数据集上进行的。这样做之后,对每个模型的结果进行了比较。本实验中使用的模型是Gonzalez-Garcia模型、Detectron的Faster R-CNN和YOLOv5。它们被训练和测试的数据集是流行的模式分析、统计建模和计算学习视觉对象类(PASCAL VOC)挑战数据集之一,特别是VOC 2010。本报告首先介绍了每个目标检测模型和VOC数据集的概况。然后给出了关于实验的更多细节,以及结果和结论。