
近日,我们食品计算小组关于食品知识图谱的综述工作“Applications of knowledge graphs for the food science and industry” (Weiqing Min, Chunlin Liu, Leyi Xu, Shuqiang Jiang*)发表在Patterns (Cell Press) 上。Patterns是Cell Press旗下的学术期刊,旨在发表数据科学领域突破性的原创研究,分享计算机科学、生命科学和社会科学等跨学科的数据科学解决方案,促进跨学科研究者之间的交流合作。

各种网络(如物联网和移动网络)、数据库(如营养表和食品成分数据库)和社交媒体(如Instagram和Twitter)的快速发展产生了海量食品数据,为使用数据驱动的计算方法研究食品科学和工业中的问题提供了前所未有的机遇。然而,这些多源异构的食品数据往往呈现信息孤岛特点,导致其难以被充分利用。知识图谱以结构化的形式提供了统一和标准化的概念体系,可以有效组织这些食品数据以便进行广泛应用。本文首先介绍了包括食品本体和食品知识图谱在内的食品知识组织方法。然后总结了食品知识图谱的代表性应用,如新配方开发、饮食疾病相关性研究和个性化饮食推荐等。最后,本文讨论了该领域的未来研究方向,如构建多模态食品知识图谱和人类健康食品知识图谱等。由于其在表示和推理方面的能力,食品知识图谱将推动食品互联网(Internet of Food)和食品智能的发展,所蕴含的巨大潜力将吸引越来越多的学者将知识图谱应用于食品科学和工业领域。





食品在人类生活中起到了至关重要的作用。食品从农场经过种植、收获、包装、加工、转化、生产、运输、分配到消费,形成了食品系统[1],这一过程产生了大量的多学科和多源的异构食品数据(如营养成分表、健康数据库、食品图像和食谱)。这些数据使得计算机技术和数字技术成为了食品科学和工业中不可或缺的一部分,也促进了食品科学和工业的发展。目前,人工智能技术已经应用在食品过程建模[2,3],食品质量评估[4],食品对象识别与分析[5-7],食品认证与溯源[8]和膳食评估[9,10]等各种与食品相关的应用中。 然而,这些食品数据仍然难以满足许多任务对数据有效共享、组织和可追溯的需求。例如,在食品供应链系统中,来自不同利益相关者的数据可能遵循不同的规范,这限制了供应链中食品术语的对齐和对不同数据源信息的融合,使得食品供应系统管理和优化的难度大大增加[11]。此外,食品污染可追溯性和暴露评估等相对复杂的问题涉及到多个领域的数据,这对食品系统融合和组织食品数据及从多源食品数据中提取食品知识的能力提出了要求[12]。因此,有必要使用一种统一术语组织食品数据,以提取食品相关信息和融合食品知识,使研究人员、食品制造商、食品分销商、零售商和消费者等不同利益相关者均能从中受益。食品本体可以用于统一食品术语,基于食品本体的食品知识图谱可以进一步建模现实世界的食品实例,并支持相关任务。这使得本体和知识图谱能够有效组织食品科学和工业中的食品数据[13,14]。


不同的食品本体重点关注食品的不同方面。具体可以分为以下四种不同类型:(1)烹饪和食谱本体,(2)营养和健康本体,(3)食品子领域本体,以及(4)全面的食品本体。 (1)烹饪和食谱本体(如Taaable[17],Cooking Ontology[18],Edamam Food Ontology和 BBC Food Ontology)主要面向烹饪行为、食物、食谱和厨具等数据,用于融合烹饪和食谱信息。 (2) 营养和健康本体关注健康和营养概念。该类本体能够起到提供饮食与营养摄入的监测和建议(如PIPS Food Ontology[19], FOODS Ontology[20]和HeLiS[21])、协助饮食推荐(如Unified Traveler and Nutrition Ontology[22])和支持营养科学研究(如ONS[23]和OFFF[24])的作用。 (3)食品子领域本体侧重于刻画具体的食品类别(如为海鲜加工设计的Seafood Ontology[25]和适配肉类供应链领域的MESCO[26])或具体的食品研究领域(如关注食品公共安全问题的FSO[27])。 (4)全面的食品本体(如FoodOn[28]和 RICHIFIELDS Ontology[29])包含全面的食品概念,这使得它们能够服务于更广泛的应用,如构建全面的食品知识图谱或融合不同来源的食品数据。


类似的,我们将食品知识图谱分为四种不同的类型,包括 (1)食谱知识图谱,(2)营养和健康知识图谱,(3)食品安全知识图谱,以及 (4)全面的食品知识图谱。 (1) 食谱知识图谱主要服务于与食谱相关的应用。比如,Foodbar Knowledge Graph[30]被用于推荐食物及提供食物相关的描述性分析服务;RcpKG[31]则能够根据个人喜好和社会关系给出合理的食谱推荐。 (2) 营养和健康知识图谱可应用于健康相关的饮食应用,如CFKG[32]被用在食物的语义搜索中,FoodKG[33]和HDKG[34]则被用于实现健康食品的推荐以及食物成分替换。此外,也有一些包含了心血管疾病知识的食品知识图谱被用于支持疾病相关的研究[35]。 (3) 食品安全知识图谱有助于构建食品安全相关的查询和智能问答系统,能够提取食品抽查信息,帮助人们获取不合格食品信息[36,37]。 (4) 全面的知识图谱(如面向食物、能源和水的FEW,侧重于农业和饮食的AgriKG [38]和研究文化的World Food Atlas[39]) 旨在收录更广泛的食品概念,协助开发各式各样的食品应用和涉及食品知识的其他领域应用。这些知识图谱被用于探索食物、农业、健康和文化之间的关系,推动跨领域研究的进一步开展。


1 新食品研发


2 食品问答系统


3 饮食-疾病关联分析


4 视觉食品分析


5 个性化食品推荐


6 食品供应链管理


7 食品装备智能制造



1 多模态食品知识图谱


2 基于食品知识图谱的推理


3 食品大数据组织与挖掘


4 食联网(IoF)


5 人类健康


6 食品智能



