摘要: 知识图谱是大数据时代下知识工程的关键技术。利用知识图谱强大的语义理解和知识组织能力,可以解决现代化农业建设中农业知识分散无序、知识覆盖范围不足等问题针对农业领域数据复杂、专业性强等特点,给出了农业知识图谱的构建方法与框架;综述了农业知识图谱构建中本体构建、知识抽取、知识融合以及知识推理四个关键技术的国内外研究现状;系统梳理了农业知识图谱在决策支持、智能问答与推荐系统的应用;最后,介绍了几个具体的农业知识图谱实例。根据农业知识图谱的研究现状,对其未来的研究方向进行了展望。 随着农业信息化的推进,农业数据量不断增加,适 逢人类由以数据互联为特征的 Web2.0时代迈入以知识 互联为特征的 Web3.0 时代[1],如何充分利用农业数据、 挖掘农业知识成了人们亟需解决的难题。 知识图谱的理念起源于语义网[2],经历了自然语言 处理技术的兴起与本体论的发展,谷歌于 2012 年正式 提出了知识图谱[3]。知识图谱最早是用来辅助搜索引擎 的搜索,以提升用户的搜索体验,后在学术界广泛应 用。如今,作为大数据时代下知识工程的关键技术之 一,知识图谱与以专家系统为代表的传统知识工程相 比,有着以下几点优势:(1)知识可视化,知识图谱可以 采用图形或者网络结构进行可视化,使得知识之间的关 系更加清晰明了。(2)知识推理能力更强,知识图谱能够 建立和发现知识之间的关联性和规律性,从而进行深入 的推理和分析。(3)知识规模更大,现代知识图谱的数据 规模动辄达到百亿级别,具有更加完整的知识储备。 在通用领域,国内外著名的知识图谱有 Freebase[4]、 Yago[5]、Zhishi.me[6]、CN-DBpedia[7]等。由于通用领域知 识图谱技术已经较为成熟,对垂直领域知识图谱的研究 逐渐变得热门起来。目前,知识图谱已经在医学[8-9]、社 交[10]、航空制造[11]、矿井建设[12]等垂直领域取得了不错的 知识管理效果。在这个背景下,农业知识图谱的引入为 农业知识工程的发展带来了新的思路和机遇。它能高 效处理农业数据,挖掘其中的知识,为农业决策提供更全面、准确的支持。农业知识图谱的应用前景广阔,是 当前农业信息化发展的热点和趋势之一。 国内外学者对农业知识图谱的研究已经取得了一 定的成果,如Liu等[13]从作物病虫害的数据特点出发,论 述了作物病虫害知识图谱的产生背景以及关键技术; Min等[14]首次对食品知识图谱进行了综述,并介绍了其 代表性应用;Mol等[15]将农业知识抽取方法分类为基于 规则与基于学习,分别探讨了各种方法的技术特点。纵 观现有的综述文献,学者们大多只关注于农业领域的某 个子领域,鲜有人对农业领域知识图谱进行全面的介 绍。因此,本文会更加强调综合性,文献的收集范围将 涵盖农业的各个领域,并且包括农业知识图谱构建全过 程、全生命周期涉及到的关键技术。此外,由于知识图 谱相关技术正处于高速发展的时期,本文在把握知识图 谱技术发展脉络的同时会致力于对新技术的介绍。 基于 Web of Science 与 CNKI,使用包括但不限于 以下主题词:“agricultural knowledge graph”or“knowledge graph of diseases and pests”or“food knowledge graph”or“construction of agricultural ontology”or“agricultural knowledge extraction”or“agricultural knowledge fusion”or“agricultural knowledge reasoning”,对 2018年 至今的文献进行模糊检索,文献类型选择非综述,并利 用追溯法对已有文献的参考文献进行扩检,共检索出 376篇文献。在对文献进行初步整理后,发现某些文献 更多地涉及生物化学技术而非知识图谱相关技术,还有 些文献使用的技术成熟度不高,这两类文献不被列入参 考范围。经过筛选,本文最终选取了 91 篇代表知识图 谱技术进展的经典文献以及与农业知识图谱相关度较 高的文献进行综述。