在之前的工作 [1, 2] 中,已经介绍了用目标-跟踪器竞争机制提升跟踪器训练效率和对目标多样轨迹的鲁棒性,并通过一系列改进方法提升了跟踪器在障碍物遮挡环境下的鲁棒性。本文将重点讨论另一种复杂场景下所存在的挑战,即视觉混淆干扰对主动目标跟踪的影响。也就是,当动态场景中存在多个与目标相似的干扰物时,如何克服可能出现的视觉混淆干扰和严重遮挡,实现稳定持续的主动目标跟踪。
对于主动目标跟踪,从若干个相似物体中识别目标并持续跟踪是非常困难的。首先,因为物体外观十分相似,使得视觉外观存在一定迷惑性,使得模型很难直接通过模板匹配找到真正的目标。其次,各个物体的移动会带来相互之间频繁遮挡,进而导致视觉观测十分局限。例如在一群穿着统一校服的学生中跟踪一个指定学生时,对跟踪器而言将存在哪些挑战?如图1所示,人群中有多个与目标着装相同且身高相近的行人在来回走动,如果只给定左边的模板示例,是否能够从右图的观测图像中找出相应的目标?显然,这不是一件容易的事情。因此,有必要就跟踪过程中存在的视觉混淆干扰问题开展研究,以实现在复杂场景下鲁棒的主动目标跟踪。