Place recognition is a key module for long-term SLAM systems. Current LiDAR-based place recognition methods are usually based on representations of point clouds such as unordered points or range images. These methods achieve high recall rates of retrieval, but their performance may degrade in the case of view variation or scene changes. In this work, we explore the potential of a different representation in place recognition, i.e. bird's eye view (BEV) images. We observe that the structural contents of BEV images are less influenced by rotations and translations of point clouds. We validate that, without any delicate design, a simple VGGNet trained on BEV images achieves comparable performance with the state-of-the-art place recognition methods in scenes of slight viewpoint changes. For more robust place recognition, we design a rotation-invariant network called BEVPlace. We use group convolution to extract rotation-equivariant local features from the images and NetVLAD for global feature aggregation. In addition, we observe that the distance between BEV features is correlated with the geometry distance of point clouds. Based on the observation, we develop a method to estimate the position of the query cloud, extending the usage of place recognition. The experiments conducted on large-scale public datasets show that our method 1) achieves state-of-the-art performance in terms of recall rates, 2) is robust to view changes, 3) shows strong generalization ability, and 4) can estimate the positions of query point clouds. Source code will be made publicly available at https://github.com/zjuluolun/BEVPlace.
翻译:位置识别是长期 SLAM 系统的关键模块 。 以 LiDAR 为基础的当前位置识别方法通常基于点云的表达方式, 如未排序点或范围图像 。 这些方法可以实现高回溯率, 但是在视图变异或场景变化的情况下, 其性能可能会降低 。 在这项工作中, 我们探索不同代表点识别方式的潜力, 即鸟眼视图( BEV) 图像 。 我们观察到 BEV 图像的结构内容受点云的旋转和翻译影响较小 。 我们确认, 没有任何微妙的设计, 受过 BEV 图像培训的简单 VGGNet 能够与稍微视图变化的状态定位相匹配 。 为了更强有力的位置识别, 我们设计了一个叫作 BEVPlace 的旋转异性网络 。 我们使用组组合来提取图像的旋转- 和 NetVLAD 用于全球特征汇总 。 此外, 我们观测到 BEV 特性特性的距离与点的几何距离是相对的。 基于观察, 我们开发了一种功能化工具, 以显示大云标值的数值 工具, 将显示 数据 显示 的大小 度 数据 数据 显示 工具 度 的 度 度 度 度 显示 的 度 度 度 度 度 度 度 度 度 度 的 的 的 度 度 度 度 度 度 的 的 度 度 度 度 度 度 度 度 度 度 度 度 值 值 度 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 值 </s>