当前人工智能正在经历从感知智能到认知智能的重要发展阶段。认知是人们获取和应用 知识的过程,因此,作为人类对客观世界认知的一种表现形式,知识图谱是认知智能研究不 可或缺的组成部分。知识图谱可以帮助机器积累人在解决问题中使用的知识,可以帮助组织 互联网资源,进而用知识赋能行业智能应用,知识图谱及其知识引擎技术已经成为人工智能 系统的基础设施。《知识图谱发展报告》(2022)是中国中文信息学会语言与知识计算专委会 邀请知识图谱领域专家结合人工智能和知识图谱技术的最新发展,在《知识图谱发展报告》 (2018)基础上对本方向前沿技术和应用的又一次系统总结,并对未来前沿趋势进行展望。
近年来,随着人工智能特别是大数据、深度学习和大规模预训练模型的快速发展,知识 图谱的理论、方法和应用也有了很大进展。
在知识表示和建模中,知识图谱表示形式更加多样化,从单一语言和符号表示的知识图 谱,到多语言和多模态的知识图谱;从结构化知识表示发展到与半结构化和非结构化数据融 合的概念-实体-上下文一体化知识表示,从符号知识表示到融合符号和数值的知识表示。
在知识获取方面,低资源、真实场景下的知识获取技术也有了长足进步,由传统限定领 域的知识抽取,到如今开放领域的多类别知识抽取;由基于知识库的关系获取,到以知识为 指导的面向大规模预训练技术的关系获取;由粗粒度有监督学习到细粒度小样本学习,以及 由单一模态的概念抽取到跨模态的联合学习。
在知识图谱应用方面,知识图谱领域应用越来越广泛,以多模态知识为驱动的虚拟数字 人推动着人工智能走向更广阔的应用场景,“知识图谱+产业”的新范式凸显着以知识为中心 的应用与现实业务的深度融合。“知识图谱+其他学科(如区块链、物联网)”的交叉研究也 正在兴起和发展。
知识图谱未来发展趋势和面临的挑战在于,能否利用大规模预训练模型进一步促进知识 表示、获取和推理技术的发展,能否基于认知推理实现具有认知能力的人工智能新架构,能 否利用知识的可解释性释放更多产业潜能和应用。 本发展报告的定位是深度科普,旨在向政府、企业、媒体中对知识图谱感兴趣的社会各 界人士简要介绍相关领域的基本概念、基本方法和应用方向,向高等院校、科研院所和高新 技术企业中从事相关工作的专业人士介绍相关领域的前沿技术和发展趋势。 本报告共由 13 章组成,每一章按照 1)任务定义、目标和研究意义;2)研究内容和关 键科学问题;3)技术方法和研究现状;4)技术展望与发展趋势等四部分的结构形成每一章的内容。每一章我们邀请了本专业领域内的专家协同撰写完成。具体结构如下: