如何从GPS定位还原公主坟高架桥地图？

2020 年 2 月 26 日 AI科技评论

作者 | 姜蔚蔚

编辑 | 贾伟

随着打车软件、导航应用的兴起，数字地图在我们的生活中发挥着越来越重要的作用。然而，传统的数字地图采集方式既费时又费力。最近几年来，我们的移动设备收集了大量的GPS轨迹信息，能否利用这些轨迹信息来生成地图呢？这不是一个简单的任务。如图1所示，(a)表示的是北京某一个路口的地图，(b)是采用点云生成的地图，无法区分不同的车道，(c)是通过GPS点连成的线段，会产生大量冗余的路段。

图1. 使用GPS轨迹生成地图的示例。

尽管存在一些挑战，过去的研究中仍然提出了三类从GPS轨迹生成地图的方法：

1）基于聚类的方法，基于距离或方向的相似度对路口进行聚类，然后相连得到路段；

2）基于轨迹合并的方法，将每一段轨迹合并到已经存在的路段或者创建新的路段；

3）基于核密度估计的方法，首先在点云上进行核密度估计，然后再生成轨迹。

前两类方法在GPS采样密度低的时候，会生成大量不存在的“捷径”，而第三类方法则会把大量临近的路段合并成一个。

下载链接：http://urban-computing.com/pdf/AAAI-RuanS.361.pdf

为了解决不同采样频率的轨迹和平行路段带来的问题，西电、京东等单位在发表于AAAI 2020 的这篇论文中，提出了一个名为DeepMG的基于深度学习的地图生成框架，包含了两个模块：

1）几何变换，从两个视图提取轨迹的特征，并且用一个名为T2RNet的轨迹-路段转换模型基于这些特征预测路段中心线；

2）拓扑构建，从预测的路段中心线提取图结构，将不同的路段进行更好的连接。

大量实验证明了DeepMG要优于以往的地图生成方法。

一、框架

这篇论文提出的DeepMG框架如图2所示。

图2. DeepMG框架示意图。

1、几何变换

1）特征提取

与以往的研究类似，这篇论文将感兴趣的区域划分为

个网格，并把每个小网格视作一个个样本点，然后从空间视图和转换视图两个角度提取特征。

DeepMG中用到了四类空间特征：（1）点：每个网格中的GPS点密度；（2）线：每个网格中的连线数量；（3）速度：每个网络内的平均移动速度；（4）方向：8个方向上的移动数量，例如东南、东等。这样空间特征可以被表示一个11维的向量，网格的空间视图即

。

DeepMG中也用到了邻近网格的变换视图，即通过二值矩阵来表示是否有出度和入度

的关系。当两个连续的GPS点连接了一个邻居网格与当前网格，那么它们之间的入-矩阵元素值为1，否则为0。类似的，当两个连续的GPS点连接了当前网络与一个邻居网格，那么它们之间的出-矩阵元素值为1，否则为0。由于这两个矩阵往往是稀疏的，因此DeepMG通过参数T来控制邻居网格的大小，即使用一个更低的空间分辨率，由此得到的变换视图可以表示为

，其中

表示二值矩阵。

2）T2RNet

如图3所示，T2RNet会基于提取的特征预测道路区域。

图3. T2RNet结构。

T2RNet包含4个部分，它们的任务分别是：

（1）Transition Embedding: 用全连接层将稀疏矩阵

转换成一个更加密集的表示

，其中 k 是嵌入纬度的大小；

（2）Shared Encoder：将特征在不同程度上进行编码；

（3）Road Region Decoder：给定上一步中的编码信息，预测道路区域；

（4）Road Centerline Decoder：同时利用第2步和第3步中的信息，预测道路的中心线。

预测的道路中心线可以通过两个网格之间的0-1变量来表示，即

。类似的，道路区域可以表示为

。为了解决道路中心线预测时

和

正负样本不均衡的问题，DeepMG采用了Dice loss[1]作为损失函数，如下所示：

最终的优化目标为：

其中

是不同目标之间的权重系数。

2、拓扑构建

几何变换模块预测的道路中心线还存在不连续和断裂的情况，并不能称得上是地图。为了解决这个问题，拓扑构建模块会连接断裂的路段，并且同时推断道路的行驶方向。

1）图提取

首先利用前人的合成方法[2]生成一个初始的无向地图。

2）连接生成

在这一步，DeepMG会利用启发式算法1，来生成所有路段之间的连接。在两种情况下会为某一个边的端点

在半径

内生成一个新的连接：（1）这条边从端点

延伸出去会与另一条边相交，此时会生成新的结点

，以及

与

之间的连接；（2）交点不存在，但是

与离

二、实验

这篇论文使用了两种不同采样频率的GPS数据集，如表1所示，其中TaxiBJ来自于T-Drive[4]，而TaxiJN来自于济南政府的非公开数据集。公开的OpenStreetMap被用作真实的基准值。

表1. 数据描述。

这篇论文衡量了生成的地图与OpenStreetMap之间的准确率，主要以平均的F1分数为指标。由于准确率会取决于几何和拓扑，这篇论文采用了跟以往工作[5]类似的评估方法，即从道路上的一个随机位置出发，找到一个最大半径内可以达到的网格。可以到达的网格标记为1，否则为0。在评估时，网格的大小被取为5米到20米，随机采样200个起始点，并且在最大半径设为2千米。

这篇论文将DeepMG与5个地图重建的基准方法进行了比较：Edelkamp [6], Chen [7], Kharita [8], Cao [9], Biagionai [10]。前三个基准方法是基于聚类的，第四个方法是基于轨迹合并的，第五个方法是基于核密度估计的。作者们也比较了不包含拓扑构建的DeepMG，记作DeepMG-nt.

图5中给出了不同方法的F1分数。相对于表现最好的基准方法，DeepMG在TaxiBJ和TaxiJN上分别取得了32.3%和6.5%的提升。由于北京市的GPS轨迹采样频率更低，DeepMG在TaxiBJ取得了更大的提升。DeepMG-nt与DeepMG的比较也显示了拓扑构建的贡献。

图5. 不同方法的F1分数。

图6给出了公主坟附近的地图构建的结果比较，可以直观地看到DeepMG的结果更加合理，能够在不产生冗余的情况下生成平行的路段。

p图6. 公主坟的地图构建结果比较。

‍

这篇论文也对不同模块分别进行了评估。首先在几何变换模块中，作者们将T2RNet中的编码-解码部分替换成另外6种网络结构：FCN [11], LinkNet [12], DeepLabV3+ [13], UNet [14], D-LinkNet [15], LinkNet + 1D Decoder [16]。结果如表2所示，从F1分数来看，FCN表现最差，而T2RNet好于其他所有方法。

表2. 不同数据集上的模型比较。

作者们也比较了优化目标中的权重系数

的影响，结果如图7所示，当

为0.2时效果最好。

图7. 的影响评估。

为了比较不同特征的影响，作者们比较了不同特征组合的影响，即P（仅点特征），L（仅线特征），S（仅空间视图特征）和A（所有特征），结果如表3所示，采用所有特征时能够得到最好的结果。

表3. 不同特征组合的影响。

最后在拓扑构建模块中，作者们评估了不同的惩罚因子

的影响，如图8所示。当

过小时，会生成很多不存在的捷径，而当

过大时，则会遗留很多中断的路段，因此作者们最终采用了

为1.4。

图8. 的影响。

三、结论

这篇论文提出了一个名为DeepMG的基于深度学习的地图生成框架，在真实的北京和济南的GPS数据集上，相对于最优的基准方法，分别取得了32.3%和6.5%的性能提升。大量的实验和参数的分析也表明了DeepMG得到了很好的优化。

参考：

[1] Milletari, F.; Navab, N.; and Ahmadi, S.-A. 2016. V-net: Fully convolutional neural networks for volumetric medical image segmentation. In 3DV, 565–571. IEEE.

[2] Shi, W.; Shen, S.; and Liu, Y. 2009. Automatic generation of road network map from massive gps, vehicle trajectories. In ITSC, 1–6. IEEE.

[3] Yuan, J.; Zheng, Y.; Zhang, C.; Xie, X.; and Sun, G.-Z. 2010b. An interactive-voting based map matching algorithm. In MDM, 43–52. IEEE Computer Society.

[4] Yuan, J.; Zheng, Y.; Zhang, C.; Xie, W.; Xie, X.; Sun, G.; and Huang, Y. 2010a. T-drive: driving directions based on taxi trajectories. In SIGSPATIAL, 99–108. ACM.

[5] Biagioni, J., and Eriksson, J. 2012a. Inferring road maps from global positioning system traces: Survey and comparative evaluation. TRANSPORT RES REC 2291(1):61–71.

[6] Edelkamp, S., and Schr¨odl, S. 2003. Route planning and map inference with global positioning traces. In Computer science in perspective. Springer. 128–151.

[7] Chen, C.; Lu, C.; Huang, Q.; Yang, Q.; Gunopulos, D.; and Guibas, L. 2016. City-scale map creation and updating using gps collections. In SIGKDD, 1465–1474. ACM.

[8] Stanojevic, R.; Abbar, S.; Thirumuruganathan, S.; Chawla, S.; Filali, F.; and Aleimat, A. 2018. Robust road map inference through network alignment of trajectories. In ICDM, 135–143. SIAM.

[9] Cao, L., and Krumm, J. 2009. From gps traces to a routable road map. In SIGSPATIAL, 3–12. ACM.

[10] Biagioni, J., and Eriksson, J. 2012b. Map inference in the face of noise and disparity. In SIGSPATIAL, 79–88. ACM.

[11] Long, J.; Shelhamer, E.; and Darrell, T. 2015. Fully convolutional networks for semantic segmentation. In CVPR, 3431–3440.

[12] Chaurasia, A., and Culurciello, E. 2017. Linknet: Exploiting encoder representations for efficient semantic segmentation. In VCIP, 1–4. IEEE.

[13] Chen, L.-C.; Papandreou, G.; Kokkinos, I.; Murphy, K.; and Yuille, A. L. 2017. Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs. TPAMI 40(4):834–848.

[14] Ronneberger, O.; Fischer, P.; and Brox, T. 2015. U-net: Convolutional networks for biomedical image segmentation. In MICCAI, 234–241. Springer.

[15] Zhou, L.; Zhang, C.; and Wu, M. 2018. D-linknet: Linknet with pretrained encoder and dilated convolution for high resolution satellite imagery road extraction. In CVPR Workshops, 182–186.

[16] Sun, T.; Di, Z.; Che, P.; Liu, C.; and Wang, Y. 2019. Leveraging crowdsourced gps data for road extraction from aerial imagery. In CVPR, 7509–7518.

登录查看更多