多目标追踪(MOT)旨在维持视频帧间物体身份的一致性。实战环境中,移动无人机采集的低帧率视频因目标外观与位置快速变化,其物体关联任务极具复杂性。云视频流传输与压缩算法导致的图像劣化更使挑战加剧。本文阐述如何通过单帧标注的实例关联学习突破这些瓶颈:场景全局特征为低帧率实例关联提供关键上下文,使解决方案对干扰物及检测间隙具备强鲁棒性;同时证明该追踪方法在降低输入图像分辨率与潜在表征尺寸以加速推理时,仍能保持高关联质量。最后,基于公开数据源构建军事车辆标注基准数据集。本研究成果最初发布于2025年5月13-14日在葡萄牙奥埃拉什举行的北约科技组织研讨会(ICMCIS),该会议由信息系统技术委员会(IST-209-RSY)主办。
无人机成本大幅降低与效能提升促使战场无人机密度激增,其产生的高质量监控视频数据规模史无前例。通过轮换部署多架侦察无人机,可实现对战线及战术纵深的持续视频监控。这极大增强战场态势感知能力,并为高效杀伤链的初始环节奠定基础。实时侦察信号的激增带来新挑战:如何将原始情报数据快速有效转化为可行动情报项。单纯依赖人工操作员监控多路视频流识别军事目标,易导致效率下降与敌情漏判——这在作战情境中后果严重。
基于实时无人机视频流的军事目标自动识别技术,成为应对海量监控数据的有效可扩展方案。以目标检测为核心的方法能缓解从视频流提取关键信号的负担,充当情报官的数据处理"辅助驾驶"。然而,单帧目标检测常无法生成可行动情报项。高效战场监控需聚焦特定军事目标——这是纯检测技术无法解决的任务。多目标追踪(MOT)与目标检测结合,构成视频军事目标识别的完整解决方案。
在实时视频流(尤其云端环境)实施神经网络监控与目标获取需消耗巨量计算资源。尽管原始视频源通常以高帧率采集(≥30帧/秒),逐帧分析既资源密集又易致延迟。因此系统通常仅解码处理部分帧序列。在此约束下,低帧率(约5帧/秒)多目标追踪技术对区分特定目标、可靠滤除干扰物(误报目标)具有关键价值。