进入21世纪以来, 地球科学研究正进入一个以建立新知识体系为核心和大数据驱动为手段的重大转折时期, 从传统的百科全书式的学科知识体系到计算机可理解与可操作的知识图谱是地学知识研究的一次革命性跃迁. 地学知识图谱在采纳一般知识表达的图模式基础上, 拓展地学知识所特有的时空特征, 融合图、文、数等地 学要素, 从而建立全域地学知识表达模型; 发展联邦式群智协同地学知识图谱构建方法, 协同全球地球科学家, 实 现高质量的专业知识图谱构建; 发展基于深度解析的多模态地学数据动态知识图谱构建方法, 从海量的地学文献 资料中提取地学知识, 实现最新、最全的动态地学知识图谱构建. 全面而系统的地学知识图谱不仅可以深化现有的地学大数据分析, 而且可以推进大数据驱动的高精度地质时间轴构建、规则与数据驱动的智能地图编制、地学知识演化与推理分析等研究, 将进一步拓展数据与知识双重驱动的地学研究新方向, 开辟地球科学、信息科学和数据科学交叉的新领域, 实现地学研究的源头创新和时空大数据研究的重大理论突破。
引言
新一轮科技革命与产业变革正在全球兴起, 人类正迈进大数据、云计算、人工智能、区块链与物联网融合发展的新科技时代, 以大数据和深度学习为基础的第二代人工智能在图像识别、语音翻译等领域得到广泛应用(Guo等, 2014; Guo, 2017a, 2017b). 大数据不仅正在改变人类生活、生产和思维的方式, 而且正在引导科学研究从实验、理论、模拟的科学范式, 进入到大数据驱动的第四科学范式(Tansley和Tolle, 2009).
现代对地观测系统实现小时级的全球监测, 各类自动观测台站网络实现了对全球降水、生物量等要素的持续观测, 数字化出版文献资料实现了随地随时可接入, 地球科学研究已经进入了一个全球覆盖、全天候监测、全要素观测的大数据时代. 同时, 作为典型的数据密集型科学, 地球科学在数据集成与共享、 数据挖掘与知识发现等方面面临诸如数据混杂、机理缺乏的空间统计分析的挑战, 大数据的众多潜在优势在地球科学相关研究中尚未得到充分发挥, 知识驱动的地球科学大数据分析的理论与方法亟待发展, 构建全域地学知识图谱、探讨地学知识演化等, 是当代地学知识研究的前沿领域和战略重点(翟明国等, 2018; 汪品先和翦知湣, 2019). 人工智能是大数据价值挖掘与提升的关键, 而知识图谱则是人工智能的重要基石之一, 是实现统计表征与物理表征融合的核心基础. 本文从地学知识表达的图模型、地学知识图谱 构建方法和地学知识图谱应用等方面, 阐述和讨论面向地学大数据分析的地学知识图谱研究的关键科学问题与前沿方向, 展望地球时空大数据分析和知识发 现的研究. 2 地学知识表达模式地学是研究地球各圈层形成、演化及其相互作用的科学, 包括大气科学、海洋科学、地理学、地质学 和地球物理学等分支学科, 其学科知识体系复杂多样 (孙鸿烈, 2017). 如何兼顾地学现象与过程的多尺度时空特征, 融合图、文、数等多种信息载体表征, 构建跨越地球科学各分支学科的地学知识表达模式是地学知识图谱研究的基础和出发点.