由于时空数据量的激增,基于位置的服务和应用的普及,以及从时空数据中提取知识以解决广泛的现实问题的重要性,在过去十年中,在空间和时空数据分析领域进行了大量的研究和开发工作。现有作品的主要目标是开发算法和技术来捕捉、存储、管理、分析和可视化空间或时空数据。
研究人员通过在现有系统中添加时空支持、从零开始开发一个处理时空数据的新系统、或实现挖掘时空数据的算法等方式做出了贡献。
现有的时空数据分析系统可分为三大类: (1) 空间数据库(SQL和NoSQL); (2)大时空数据处理基础设施; (3) 处理时空数据的编程语言和软件工具。
由于现有的调研大多针对处理空间数据的大数据基础设施,本调研探讨了空间和时空分析的整个生态系统,并对大空间数据处理系统进行了最新综述。本调研也描绘了空间和时空数据分析的重要性和未来。
概述
随着互联网、传感器设备、GPS设备以及基于位置的服务(LBS)和应用(如地图服务、推荐系统、导航系统、基于位置的社交网络等应用)的技术进步,每天都会产生大量的地理参考数据,通常被称为大空间数据。这些数据中有很大一部分都带有时间戳(时间标记),从而生成时空数据。由于智能移动设备和互联网的可用性,LBS应用程序和服务成为我们日常活动的一部分,并对数据增长做出了重大贡献。这些数据还来自其他来源,如车辆、位于世界各地的传感器、卫星、空间望远镜、航空摄影、土地调查、医疗成像等。因此,从如此巨大的时空数据中挖掘信息不仅对我们今天使用的热门LBS应用和服务很重要,而且对科学发现和广泛的应用领域的探索也很重要,如气候变化分析、地震分析、天气预报、城市规划、医疗保健、现代交通系统、农业、空间探索、犯罪数据分析、电子商务和广告、流行病分析、动物迁徙、海洋学等等。在这种情况下,需要有效的工具和数据处理系统来存储、管理、分析和可视化高维和异构的大时空数据。
空间和时空数据库系统的研究和开发始于传统的关系数据库系统(RDBMSs)。带有空间扩展的传统rdbms(如PostgreSQL/PostGIS[174]、Oracle spatial等)在单个节点计算环境中非常有效。然而,由于缺乏并行性和I/O瓶颈,这些系统只能很好地工作于相对较小的数据集。此外,这些系统的分析和可视化能力有限。因此,人们可能会质疑空间RDBMSs在这个大空间数据时代是否有意义。研究人员不断增加新功能,使这些系统适应新时代。研究人员还利用空间rdbms开发了几个并行分布式系统。虽然目前的空间rdbms不是大规模可伸缩的,但这些系统的可伸缩性足以解决我们今天面临的许多现实问题。在企业级的广泛应用领域中,对空间RDBMSs有着巨大的需求。因此,空间RDBMSs在这个大空间和时空数据的时代仍然具有重要意义。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“STDA” 就可以获取《「时空数据分析」综述论文,44页pdf》专知下载链接