The ubiquity of missing data in urban intelligence systems, attributable to adverse environmental conditions and equipment failures, poses a significant challenge to the efficacy of downstream applications, notably in the realms of traffic forecasting and energy consumption prediction. Therefore, it is imperative to develop a robust spatio-temporal learning methodology capable of extracting meaningful insights from incomplete datasets. Despite the existence of methodologies for spatio-temporal graph forecasting in the presence of missing values, unresolved issues persist. Primarily, the majority of extant research is predicated on time-series analysis, thereby neglecting the dynamic spatial correlations inherent in sensor networks. Additionally, the complexity of missing data patterns compounds the intricacy of the problem. Furthermore, the variability in maintenance conditions results in a significant fluctuation in the ratio and pattern of missing values, thereby challenging the generalizability of predictive models. In response to these challenges, this study introduces GeoMAE, a self-supervised spatio-temporal representation learning model. The model is comprised of three principal components: an input preprocessing module, an attention-based spatio-temporal forecasting network (STAFN), and an auxiliary learning task, which draws inspiration from Masking AutoEncoders to enhance the robustness of spatio-temporal representation learning. Empirical evaluations on real-world datasets demonstrate that GeoMAE significantly outperforms existing benchmarks, achieving up to 13.20\% relative improvement over the best baseline models.


翻译:在城市智能系统中,由于恶劣环境条件和设备故障导致的数据缺失普遍存在,这对下游应用(尤其是交通流量预测和能耗预测)的有效性构成了重大挑战。因此,亟需开发一种鲁棒的时空学习方法,能够从不完整数据集中提取有意义的洞察。尽管存在针对含缺失值的时空图预测的方法,但未解决的问题依然存在。首先,现有研究大多基于时间序列分析,从而忽视了传感器网络中固有的动态空间相关性。其次,缺失数据模式的复杂性加剧了问题的难度。此外,维护条件的差异导致缺失值的比例和模式存在显著波动,从而对预测模型的泛化能力提出了挑战。为应对这些挑战,本研究提出了GeoMAE,一种自监督的时空表示学习模型。该模型由三个主要组件构成:输入预处理模块、基于注意力的时空预测网络(STAFN)以及一个辅助学习任务,该任务借鉴了掩码自编码器的思想,以增强时空表示学习的鲁棒性。在真实数据集上的实证评估表明,GeoMAE显著优于现有基准模型,相对于最佳基线模型实现了高达13.20%的相对性能提升。

0
下载
关闭预览

相关内容

【AAAI2023】基于Dirichlet元模型的事后不确定性学习
专知会员服务
16+阅读 · 2022年12月16日
【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习
专知会员服务
19+阅读 · 2021年2月12日
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员