我们生活在一个前所未有的环境变化时代,这主要是由化石燃料对地球气候的影响和人类土地使用的不断扩张所驱动的。为了减缓和适应这些变化,我们需要了解它们对人类和自然系统的无数影响。实现这一目标需要各种环境因素的地理空间数据,包括气候、植被、生物多样性、土壤、地形、水和人口等。一致的监测也是必要的,以识别哪里正在发生变化以及它们发生的速度。由地球观测卫星和地基传感器收集了大量相关数据。然而,仅有数据是不够的。有效使用它们需要适当操作和分析的工具。
数据科学这个迅速崭露头角的领域为分析大型和复杂数据集提供了丰富的技术,包括描述性、解释性和预测性分析的方法。然而,实际应用这些方法通常只是整个数据科学工作流程的一小部分。其他关键任务包括筛选可疑数据、处理缺失值、整合来自多个来源的数据、为分析总结变量以及可视化数据和分析结果。尽管现在有很多关于统计和机器学习方法的书籍,但涉及地理空间数据处理和分析的更广泛主题的书籍则相对较少。 《地理数据科学与R(GDSWR)》的目的就是填补这一空白。GDSWR提供了一系列教程,旨在教授使用时序和地理空间数据解决与环境变化相关的问题的良好实践。它基于R语言和环境,这目前为使用单一平台处理各种来源的空间和非空间数据提供了最佳选项。这本书并不意在提供R的全面概述,而是采用基于示例的方法,介绍如何使用各种数据集解决多样问题。
GDSWR的材料最初是为地理空间数据科学的高级本科和研究生课程开发的。它也适用于希望扩展其在R中使用地理空间数据能力的学生或专业人士进行个人学习。尽管这本书并非旨在作为全面的参考手册,但它也可以为寻找可用于新应用的特定方法的示例的读者提供帮助。教程侧重于物理地理,并利用各种数据源,包括气象站数据、网格化气候数据、分类土地覆盖数据和数字高程模型。我衷心希望GDSWR能帮助读者提高他们使用R的熟练度,以便他们能实施更为复杂的数据科学工作流程,有效利用多样的地理数据源。这些技能将使他们能够解决紧迫的科学问题,并开发新的地理空间应用,从而增进我们对不断变化的世界的理解。