城市可用停车位预测对于帮助司机找到停车位、帮助政府进行城市规划、缓解城市交通拥堵具有重要意义。
在本项工作中,我们基于停车场周边的环境上下文数据(POI分布,人流量等)和部分停车场实时的可用停车位数据来进行全市范围的可用停车位的预测。在这项工作中我们主要解决了以下挑战:(1)空间关联性。停车场的可用性不仅受到附近停车场占用情况的影响,而且还可能与远处的停车场相关。第一个挑战就是如何对不规则且非欧几里得的停车场之间的空间关联性进行建模(2)时间关联性。停车场未来的可用停车位与它过去的时间段的可用停车位相关,包括短期和长期的时间依赖性。而且,停车场之间的空间关联性可能随时间不断变化。如何对停车场的长短期动态时间关联性进行建模是第二个挑战。(3)可用停车位数据的稀疏性。只有一小部分的停车场拥有实时传感器,能够检测当前停车场的可用停车位数量。所以第三个挑战就是如何利用稀疏的实时可用停车位数据。
基于以上挑战,我们提出了半监督层次循环图神经网络SHARE-X。我们提出了一种层次图卷积模块建模停车场之间的空间关联性。在层次图卷积模块中,我们首先提出一种上下文图卷积模块建模停车场之间的动态局部相关性,其次我们设计了一种多分辨率软聚类图卷积模块用于建模停车场之间的全局空间相关性。之后为了建模短期和长期时间关联性,我们提出层次注意力循环网络。最后我们采用可用停车位估计模块从时间和空间域分别对未安装传感器的停车场的可用停车位数量的分布进行估计,并通过一种基于熵的机制对两种估计值进行融合。我们在两个真实数据集上进行了实验,我们的模型超越了所有基线方法。
本文工作由中国科学技术大学、百度商务智能实验室(BIL)与罗格斯大学联合完成,相关成果已被中国计算机学会推荐A类国际期刊IEEE TKDE录用,论文信息如下:
论文标题:
Semi-Supervised City-Wide Parking Availability Prediction via Hierarchical Recurrent Graph Neural Network
期刊名称:
IEEE Transactions on Knowledge and Data Engineering
论文作者:
Weijia Zhang, Hao Liu, Yanchi Liu, Jingbo Zhou, Tong Xu, Hui Xiong
1. 问题定义
考虑停车场的集合
定义1:可用停车位(PA)。给定一个停车场
我们使用
问题1:可用停车位预测。给定时间窗口
其中
2. 模型概述
SHARE-X的框架如图1所示,其中输入是所有停车场
图1 SHARE-X的总框架
3. 层次图卷积
3.1上下文图卷积
在本节中,我们假设所有的图卷积操作都是在时间上执行,因此我们省略了符号的时间上标以方便表示。
在空间领域,邻近的停车场之间往往具有很强的相关性,并且常常相互影响。比如,当一个音乐厅正在举行一个音乐会,那么这个音乐厅及其附近的停车场的可用停车位往往会很少,并且停车的需求往往从该音乐厅附近逐渐向远处扩散。为了建模这种局部的空间相关性,我们对局部的停车场的空间联系建模成图
其中
我们通过Attention机制,来计算不同停车场之间的权重系数
为避免二次的时间复杂度,我们在计算邻近分数时只关注与
一旦我们得到
我们可以堆叠L层相同的上下文图卷积,以捕获L-hop的局部依赖。
3.2多分辨率软聚类图卷积
为弥补局部空间建模的不足,我们对远距离的停车场间进行建模。对远距离的空间关系进行建模的动机是,相距很远但在相似功能区的停车场可能会有相似的PA,比如:商务区的停车场在办公时间可能有较低的PA,而住宅区此时可能有较高的PA。
因此,我们提出了多分辨率软聚类图卷积(MrscConv)来捕捉全局的停车场之间的相关性,如图2所示。
图2 多分辨率软聚类图卷积
3.2.1软聚类图卷积
首先介绍基础的软聚类图卷积,软聚合图卷积(SCConv)定义
定义
一旦软分配矩阵
给定每个潜在节点的表征,类似于CxtConv,我们也使用图卷积操作去捕捉潜在节点之间的依赖关系,生成新的潜在节点表征:
其中
当
3.2.2多分辨率泛化
我们扩展SCConv到多重分辨率,MrscConv通过对远距离的停车场的潜在层次关系建模来提高预测能力。
假设有层SCConv,考虑第
在得到不同分辨率下的潜在节点表征后,一个需解决的任务是如何为每一个停车场生成一个统一的软聚类表征。为了达到这目的,对于第层 SCConv ,我们进一步定义软转移矩阵:
其中
最后我们将不同分辨率的软聚类表征拼接,得到最终的软聚类表征:
4. 层次注意力循环神经网络
这部分内容我们设计了HARN同时对长短期的时间依赖进行建模,HARN的结构如图4所示:
图3 HARN的整体结构
4.1 基础循环神经网络
我们使用GRU作为HARN的基础模块,定义
其中
4.2 层次注意力循环神经网络
然而单纯的使用GRU会出现两个问题:1)忽视了过去时间步的重要性差异;2)GRU在建模长期依赖时面临梯度消失的问题。为了解决第一个问题,我们引入了短时的注意力操作去量化应给予前
其中
同时为了解决长期依赖建模中梯度消失的问题,我们考虑利用PAs的日周期性。具体来说,如果要预测接下来
然后我们通过
再通过长期注意力操作,我们可以得到
其中
最后,我们通过连接操作,得到最终表征:
5. 可用停车位估计
为了利用部分可观测的PAs,我们从空间和时间两个领域估计缺失的PAs。为了保存更多的信息量,我们不直接估计标量
5.1 基于空间的PA估计
与CxtConv类似,对于每个
其中
5.2 基于时间的PA估计
我们再次使用GRU模块的隐藏状态从时间领域来估计PA分布:
5.3 PA估计融合
我们并不直接平均
我们按如下方式融合:
其中
6. 模型训练
因为只有部分停车场有可观测的PAs,按照图的半监督学习范式,SHARE-X旨在最小化
并且,我们增加两个交叉熵(CE)误差项来增强PA估计的准确性:
最后,同时考虑MSE和CE误差,SHARE-X算法最小化以下联合损失:
其中
7. 实验
7.1 数据集描述
实验的数据集来自北京和深圳两个城市的真实停车场数据。
7.2 总体实验结果
实验结果从各个指标上都打败了所有baseline,验证了模型的有效性,如表2所示:
7.3 消融实验
我们进行了消融实验。分别验证了空间,时间以及PA估计模块的有效性,如图4所示:
图4 消融实验
7.4 参数敏感性
此外我们针对模型中的一些可调参数做了充分的参数敏感性实验,如图5所示:
图5 参数敏感性实验
7.5 其他实验
除此之外我们还设计实验,从不同时间和空间上分别验证了模型的效果;以及对我们模型以及基线模型的运行效率进行了对比和分析。
8. 总结
在本文中,我们提出了SHARE-X,一个基于环境上下文数据和部分可观测的实时停车可用性数据的全市停车可用性预测框架。我们首先提出了一种层次图卷积模块来捕获局部和全局空间依赖关系。然后,采用分层注意力递归网络捕获每个停车场的短期以及长期时间依赖性。此外,我们还提出了一种针对无实时停车可用性信息的停车场的停车可用性近似模块。在两个真实世界数据集上的实验结果表明,SHARE-X在全市停车可用性预测方面的性能显著优于8个先进的基线模型。