地理空间分析在许多领域都是重要的,包括犯罪科学、交通科学、流行病学、生态学和城市规划。然而,随着大型地理空间数据的快速增长,大部分常用的地理空间分析工具对于大规模数据集的支持并不高效(甚至是不可行的)。因此,领域专家对使用这些工具的效率问题提出了担忧。在这个教程中,我们的目标是唤起数据库研究者对这个重要的、新兴的、与数据库相关的、跨学科的主题的关注,该主题分为四部分。在第一部分,我们将讨论不同的问题,并强调两种类型的地理空间分析工具的挑战,即(1)热点检测和(2)相关性分析。在第二部分和第三部分,我们将特别讨论两个地理空间分析工具,即核密度可视化(代表性的热点检测方法)和K函数(代表性的相关性分析方法),以及它们的变体。在第四部分,我们将强调这个主题的未来机会。

地理空间分析在许多学科中都占有重要地位。一些代表性的例子包括犯罪学、交通科学、流行病学、生态学和城市规划。犯罪学家和交通科学家分别需要在不同的地理区域发现犯罪和交通事故热点。流行病学家需要检测疾病爆发,识别不同疾病的传播模式,并分析疾病因素。生态学家需要了解环境事件(例如,空气污染)的分布。城市规划者需要分析不同城市的人口流动。因此,已经开发了许多现成的软件包,例如QGIS、ArcGIS、CrimeStat、spatstat、spNetwork和SANET,以支持地理空间分析。然而,在大数据时代,现在可以收集和分析许多大规模的位置数据集。例如,芝加哥犯罪数据集和纽约出租车数据集分别包含768万和1.65亿个数据点。更糟糕的是,地理空间分析中常用的许多工具(例如,核密度可视化(KDV)、K函数和空间聚类)都有很高的时间复杂度(例如,计算一个K函数需要O(n^2)时间,其中n表示数据点的数量)。基于上述原因,这些工具不能被现成的软件包有效(甚至是可行)地支持,这也是许多领域专家的抱怨。

因此,为这些地理空间分析工具开发高效的算法和软件是一个重要的、新兴的、与数据库相关的、跨学科的主题。尽管在数据库社区已经给出了许多与空间/时空数据库和数据可视化相关的教程[38, 43, 63, 70, 72, 85, 90, 103, 113],但是这些教程都没有专注于提高这些地理空间分析工具的效率。因此,我们提出了这个教程,以唤起数据库研究者和实践者对理解这个重要主题的不同问题、挑战和机会的关注。特别是,我们还将讨论两个常用工具,即核密度可视化(KDV)和K函数的最新解决方案,以提供解决这些地理空间分析问题的洞察。

成为VIP会员查看完整内容
17

相关内容

【ICDM 2022教程】图挖掘中的公平性:度量、算法和应用
专知会员服务
27+阅读 · 2022年12月26日
【IJCAI2021】复杂知识库问答研究: 方法、挑战与对策
专知会员服务
54+阅读 · 2021年5月27日
【NeurIPS 2020】深度学习的不确定性估计和鲁棒性
专知会员服务
49+阅读 · 2020年12月8日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
「扩散模型」Awesome资料最新大合集
专知
3+阅读 · 2022年10月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
407+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
146+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员