题目: Probabilistic Regression for Visual Tracking
简介:
从根本上说,视觉跟踪是在每个视频帧中使目标状态回归的问题。尽管取得了重大进展,但跟踪器仍然容易出现故障和不准确的情况。因此,至关重要的是在目标估算中表示不确定性。尽管当前的主要范式依赖于估计与状态有关的置信度得分,但是该值缺乏明确的概率解释,使它的使用变得复杂。因此,在这项工作中,我们提出了概率回归公式,并将其应用于跟踪。我们的网络预测给定输入图像后焦油状态的条件概率密度。至关重要的是,我们的配方能够对由于任务中不正确的注释和歧义而产生的标签噪声进行建模。通过最小化Kullback Leibler差异来训练回归网络。当应用于跟踪时,我们的公式不仅允许输出的概率表示,而且还可以显着提高性能。我们的跟踪器在六个数据集上设置了最新的技术,在LaSOT上实现了59.8%的AUC,在Tracking Net上实现了75.8%的成功。可以在https://github.com/visionml/pytracking获得代码和模型。