Recent object tracking methods depend upon deep networks or convoluted architectures. Most of those trackers can hardly meet real-time processing requirements on mobile platforms with limited computing resources. In this work, we introduce the Siamese Transformer Pyramid Network (SiamTPN), which inherits the advantages from both CNN and Transformer architectures. Specifically, we exploit the inherent feature pyramid of a lightweight network (ShuffleNetV2) and reinforce it with a Transformer to construct a robust target-specific appearance model. A centralized architecture with lateral cross attention is developed for building augmented high-level feature maps. To avoid the computation and memory intensity while fusing pyramid representations with the Transformer, we further introduce the pooling attention module, which significantly reduces memory and time complexity while improving the robustness. Comprehensive experiments on both aerial and prevalent tracking benchmarks achieve competitive results while operating at high speed, demonstrating the effectiveness of SiamTPN. Moreover, our fastest variant tracker operates over 30 Hz on a single CPU-core and obtaining an AUC score of 58.1% on the LaSOT dataset. Source codes are available at https://github.com/RISCNYUAD/SiamTPNTracker


翻译:最近的物体跟踪方法取决于深层网络或混杂结构。 这些跟踪器大多无法在有限的计算资源范围内满足移动平台上的实时处理要求。 在这项工作中,我们引入了Siammese变换器金字塔网络(SiampTPN),它继承了CNN和变换器结构的优势。 具体地说,我们利用轻量网络(ShuffleNetV2)的固有特征金字塔,并通过一个变异器加强它,以构建一个强有力的目标特定外观模型。 正在开发一个具有横向交叉关注的中央结构,以建立扩大高水平的地貌地图。为避免计算和记忆强度,同时与变换器混合金字塔显示,我们进一步引入集合关注模块,这极大地减少了记忆和时间复杂性,同时改进了坚固性。 航空和流行跟踪基准的综合实验取得了竞争性结果,同时高速运行,展示了SiamTPN的效能。 此外,我们最快的变式跟踪器在单一的CPU核心上运行超过30赫兹,并在 LaSCNOD数据集上获得58.1%的ACUD代码。

0
下载
关闭预览

相关内容

Pyramid is a small, fast, down-to-earth Python web application development framework.
专知会员服务
36+阅读 · 2021年5月12日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
22+阅读 · 2021年4月20日
专知会员服务
61+阅读 · 2020年3月19日
专知会员服务
110+阅读 · 2020年3月12日
ECCV 2020 目标跟踪论文大盘点
极市平台
7+阅读 · 2020年10月4日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
语义分割+视频分割开源代码集合
极市平台
35+阅读 · 2018年3月5日
深度学习的快速目标跟踪
AI研习社
13+阅读 · 2018年1月8日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
Arxiv
7+阅读 · 2021年6月21日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
3+阅读 · 2020年11月28日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年3月20日
VIP会员
相关论文
Arxiv
7+阅读 · 2021年6月21日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
3+阅读 · 2020年11月28日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年3月20日
Top
微信扫码咨询专知VIP会员