3D object tracking in point clouds is still a challenging problem due to the sparsity of LiDAR points in dynamic environments. In this work, we propose a Siamese voxel-to-BEV tracker, which can significantly improve the tracking performance in sparse 3D point clouds. Specifically, it consists of a Siamese shape-aware feature learning network and a voxel-to-BEV target localization network. The Siamese shape-aware feature learning network can capture 3D shape information of the object to learn the discriminative features of the object so that the potential target from the background in sparse point clouds can be identified. To this end, we first perform template feature embedding to embed the template's feature into the potential target and then generate a dense 3D shape to characterize the shape information of the potential target. For localizing the tracked target, the voxel-to-BEV target localization network regresses the target's 2D center and the $z$-axis center from the dense bird's eye view (BEV) feature map in an anchor-free manner. Concretely, we compress the voxelized point cloud along $z$-axis through max pooling to obtain a dense BEV feature map, where the regression of the 2D center and the $z$-axis center can be performed more effectively. Extensive evaluation on the KITTI and nuScenes datasets shows that our method significantly outperforms the current state-of-the-art methods by a large margin.


翻译:点云中的 3D 对象跟踪仍是一个挑战性的问题, 因为在动态环境中, LiDAR 点的偏僻性强。 在此工作中, 我们建议使用 siames voxel 至 BEV 跟踪器, 它可以显著改善 3D 点云中的跟踪性能。 具体地说, 它由 siamese 形状- worce 特征学习网络和 voxel- to- BEV 目标本地化网络组成。 siames 形状学习网络可以捕捉该对象的 3D 形状信息, 以学习该对象在动态环境中的区别性能, 从而可以辨明稀疏云层云层中的潜在目标。 为此, 我们首先使用模板功能将模板的特性嵌入到潜在的3D点, 然后生成一个密度 3D 形状来描述潜在目标的形状信息。 为了定位目标的本地化目标, voxel- to BEVEV 目标定位网络将目标的中心和 $z- 轴中点从密度鸟眼视图( BEVEVEV) 地图中, 定位地图中以免费方式显示 $xxxx 中心 。 我们通过 中 的 的 的 中位值中心, 以 以 AS- borx- cremaxx- creal- sal- creal- cremax- sal- creal- sal- crexxxxxxxxx- sal- sal- sal- sal- sal- sald- crevald- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sal- sald- sal ex ex- sal- sal- sessal- sal- sal- sal- sal- sal- sal- sal- sal- ex ex- s- sal- sal- sal- sal- sal- ex- ex- ex- sal- sal-

0
下载
关闭预览

相关内容

MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
专知会员服务
15+阅读 · 2021年4月3日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
CVPR2019 有关姿态估计方面的论文和代码
极市平台
4+阅读 · 2019年7月13日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
Fully-Convolutional Siamese Networks for Object Tracking论文笔记
统计学习与视觉计算组
9+阅读 · 2018年10月12日
Arxiv
6+阅读 · 2021年11月12日
Deep Learning for 3D Point Clouds: A Survey
Arxiv
3+阅读 · 2019年12月27日
Arxiv
11+阅读 · 2019年1月24日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员