Current 3D single object tracking approaches track the target based on a feature comparison between the target template and the search area. However, due to the common occlusion in LiDAR scans, it is non-trivial to conduct accurate feature comparisons on severe sparse and incomplete shapes. In this work, we exploit the ground truth bounding box given in the first frame as a strong cue to enhance the feature description of the target object, enabling a more accurate feature comparison in a simple yet effective way. In particular, we first propose the BoxCloud, an informative and robust representation, to depict an object using the point-to-box relation. We further design an efficient box-aware feature fusion module, which leverages the aforementioned BoxCloud for reliable feature matching and embedding. Integrating the proposed general components into an existing model P2B, we construct a superior box-aware tracker (BAT). Experiments confirm that our proposed BAT outperforms the previous state-of-the-art by a large margin on both KITTI and NuScenes benchmarks, achieving a 15.2% improvement in terms of precision while running ~20% faster.


翻译:当前 3D 单个对象跟踪方法基于目标模板和搜索区域之间的特征比较, 跟踪目标。 但是, 由于LIDAR 扫描中常见的封闭性, 对严重稀疏和不完整的形状进行准确的特征比较并非三重性。 在这项工作中, 我们利用第一个框架给定的地面真相约束框作为加强目标对象特征描述的有力提示, 能够以简单而有效的方式进行更准确的特征比较。 特别是, 我们首先提议 BoxCloud, 信息丰富和有力的演示, 用点对箱关系描述一个对象。 我们进一步设计一个高效的箱对箱组合性特征模块, 利用上述箱状组合进行可靠的特征匹配和嵌入。 将拟议的一般组件纳入现有的模型 P2B, 我们建造了一个高级的箱对质跟踪器( BAT ) 。 实验证实, 我们提议的 BAT 在 KITTI 和 Nuscenes 基准上大大的比值差, 实现15.2%的精确度改进, 同时运行 ~ 20% 。

0
下载
关闭预览

相关内容

标跟踪是指:给出目标在跟踪视频第一帧中的初始状态(如位置,尺寸),自动估计目标物体在后续帧中的状态。 目标跟踪分为单目标跟踪和多目标跟踪。 人眼可以比较轻松的在一段时间内跟住某个特定目标。但是对机器而言,这一任务并不简单,尤其是跟踪过程中会出现目标发生剧烈形变、被其他目标遮挡或出现相似物体干扰等等各种复杂的情况。过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势。2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
专知会员服务
110+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
【泡泡一分钟】基于运动估计的激光雷达和相机标定方法
泡泡机器人SLAM
25+阅读 · 2019年1月17日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
STRCF for Visual Object Tracking
统计学习与视觉计算组
14+阅读 · 2018年5月29日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
6+阅读 · 2021年11月12日
Arxiv
17+阅读 · 2021年3月29日
Deep Learning for 3D Point Clouds: A Survey
Arxiv
3+阅读 · 2019年12月27日
Arxiv
8+阅读 · 2018年3月20日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员