Siamese network based trackers formulate 3D single object tracking as cross-correlation learning between point features of a template and a search area. Due to the large appearance variation between the template and search area during tracking, how to learn the robust cross correlation between them for identifying the potential target in the search area is still a challenging problem. In this paper, we explicitly use Transformer to form a 3D Siamese Transformer network for learning robust cross correlation between the template and the search area of point clouds. Specifically, we develop a Siamese point Transformer network to learn shape context information of the target. Its encoder uses self-attention to capture non-local information of point clouds to characterize the shape information of the object, and the decoder utilizes cross-attention to upsample discriminative point features. After that, we develop an iterative coarse-to-fine correlation network to learn the robust cross correlation between the template and the search area. It formulates the cross-feature augmentation to associate the template with the potential target in the search area via cross attention. To further enhance the potential target, it employs the ego-feature augmentation that applies self-attention to the local k-NN graph of the feature space to aggregate target features. Experiments on the KITTI, nuScenes, and Waymo datasets show that our method achieves state-of-the-art performance on the 3D single object tracking task.


翻译:以 Siamese 网络为基础的跟踪器将3D 单个对象的跟踪作为模板点特征和搜索区域之间的交叉关系学习。 由于模板和搜索区域在跟踪过程中出现巨大的外观差异, 如何在搜索区域中学习识别潜在目标的紧密交叉关系仍然是一个棘手的问题。 在本文件中, 我们明确使用变换器来组建 3D siamese 变异器网络, 学习模板和点云搜索区域之间的牢固交叉关系。 具体地说, 我们开发了 siamse 点变异器网络, 以通过交叉关注来构建目标的上下文信息。 其编码器使用自我注意来捕捉点云的非本地信息来描述对象的形状信息, 而解码器则利用交叉注意来增加歧视点特性。 之后, 我们开发了一个迭接的 Commission- commission- transporterger 网络, 学习模板和点云搜索区域搜索区域之间的牢固交叉相互关系。 它设计了跨性增强性增强性能将模板与搜索区域的潜在目标联系起来。 为了进一步增强潜在目标目标目标, 它利用了潜在的目标目标, 它利用了自我跟踪功能, 它利用了自我定位- 将自我定位定位定位定位定位定位定位的图像- 和自我定位- 性定位- 性格- 性格- 来显示工具- 自我定位- 性格- 性格- 性格- 性格- 性格- 性格- 性- 性格- 性格- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能- 性能-

0
下载
关闭预览

相关内容

专知会员服务
59+阅读 · 2020年3月19日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
161+阅读 · 2020年3月18日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
VCIP 2022 Call for Special Session Proposals
CCF多媒体专委会
1+阅读 · 2022年4月1日
【ICIG2021】Latest News & Announcements of the Tutorial
中国图象图形学学会CSIG
2+阅读 · 2021年12月20日
【ICIG2021】Latest News & Announcements of the Plenary Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年11月2日
【ICIG2021】Latest News & Announcements of the Industry Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年7月29日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
17+阅读 · 2021年3月29日
Interpretable CNNs for Object Classification
Arxiv
20+阅读 · 2020年3月12日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员