Current 3D single object tracking approaches track the target based on a feature comparison between the target template and the search area. However, due to the common occlusion in LiDAR scans, it is non-trivial to conduct accurate feature comparisons on severe sparse and incomplete shapes. In this work, we exploit the ground truth bounding box given in the first frame as a strong cue to enhance the feature description of the target object, enabling a more accurate feature comparison in a simple yet effective way. In particular, we first propose the BoxCloud, an informative and robust representation, to depict an object using the point-to-box relation. We further design an efficient box-aware feature fusion module, which leverages the aforementioned BoxCloud for reliable feature matching and embedding. Integrating the proposed general components into an existing model P2B, we construct a superior box-aware tracker (BAT). Experiments confirm that our proposed BAT outperforms the previous state-of-the-art by a large margin on both KITTI and NuScenes benchmarks, achieving a 12.8% improvement in terms of precision while running ~20% faster.


翻译:当前 3D 单个对象跟踪方法基于目标模板和搜索区域之间的特征比较, 跟踪目标。 但是, 由于LiDAR 扫描中常见的封闭性, 对严重稀疏和不完整的形状进行准确的特征比较并非三重性。 在这项工作中, 我们利用第一个框架给定的地面真相约束框, 作为加强目标对象特征描述的有力提示, 能够以简单而有效的方式进行更准确的特征比较。 特别是, 我们首先提议 BoxCloud, 一个信息丰富和强有力的演示, 用点对箱关系描述一个对象。 我们进一步设计一个高效的箱对箱组合性特征模块, 利用上述箱状组合进行可靠的特征匹配和嵌入。 将拟议的一般组件纳入现有的模型 P2B, 我们建造了一个高级的箱对质跟踪器( BAT)。 实验证实, 我们提议的BAT 在 KITTI 和 Nuscenes 基准上都大大的比值差, 实现12.8%的精确度改进, 同时运行 ~ 20% 。

0
下载
关闭预览

相关内容

标跟踪是指:给出目标在跟踪视频第一帧中的初始状态(如位置,尺寸),自动估计目标物体在后续帧中的状态。 目标跟踪分为单目标跟踪和多目标跟踪。 人眼可以比较轻松的在一段时间内跟住某个特定目标。但是对机器而言,这一任务并不简单,尤其是跟踪过程中会出现目标发生剧烈形变、被其他目标遮挡或出现相似物体干扰等等各种复杂的情况。过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势。2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
32+阅读 · 2021年9月16日
专知会员服务
118+阅读 · 2020年7月22日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
已删除
将门创投
7+阅读 · 2018年4月18日
Deep Learning for 3D Point Clouds: A Survey
Arxiv
3+阅读 · 2019年12月27日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关资讯
已删除
将门创投
7+阅读 · 2018年4月18日
Top
微信扫码咨询专知VIP会员