题目: Deep Learning for Visual Tracking: A Comprehensive Survey
简介: 视觉目标跟踪是计算机视觉领域中最受关注和最具挑战性的研究课题之一。考虑到这个问题的不适定性质及其在现实世界中广泛应用的情况,已经建立了大量的大型基准数据集,在这些数据集上已经开发了相当多的方法,并在近年来取得了显著进展——主要是最近基于深度学习(DL)的方法。这项综述的目的是系统地调查当前基于深度学习的视觉跟踪方法、基准数据集和评估指标。它也广泛地评价和分析领先的视觉跟踪方法。首先,从网络体系结构、网络利用、视觉跟踪网络训练、网络目标、网络输出、相关滤波优势利用六个关键方面,总结了基于dll的方法的基本特征、主要动机和贡献。其次,比较了常用的视觉跟踪基准及其各自的性能,总结了它们的评价指标。第三,在OTB2013、OTB2015、VOT2018和LaSOT等一系列成熟的基准上,全面检查最先进的基于dll的方法。最后,通过对这些最先进的方法进行定量和定性的批判性分析,研究它们在各种常见场景下的优缺点。它可以作为一个温和的使用指南,让从业者在什么时候、在什么条件下选择哪种方法。它还促进了对正在进行的问题的讨论,并为有希望的研究方向带来光明。