[目的/意义] 近年来,人工智能在农业领域的应用取得了显著进展,但仍面临诸如模型数据收集标记困 难、模型泛化能力弱等挑战。大模型技术作为近期人工智能领域新的热点技术,已在多个行业的垂直领域中展现 出了良好性能,尤其在复杂关联表示、模型泛化、多模态信息处理等方面较传统机器学习方法有着较大优势。[进 展] 本文首先阐述了大模型的基本概念和核心技术方法,展示了在参数规模扩大与自监督训练下,模型通用能力 与下游适应能力的显著提升。随后,分析了大模型在农业领域应用的主要场景;按照语言大模型、视觉大模型和 多模态大模型三大类,在阐述模型发展的同时重点介绍在农业领域的应用现状,展示了大模型在农业上取得的研 究进展。[结论/展望] 对农业大模型数据集少而分散、模型部署难度大、农业应用场景复杂等困难提出见解,展 望了农业大模型未来的发展重点方向。预计大模型将在未来提供全面综合的农业决策系统,并为公众提供专业优 质的农业服务。
大 模 型 (Big Models)[1] , 或 称 基 础 模 型 (Foundation Models)[2] ,指经过在大规模数据上训 练,具有庞大参数量的深度神经网络模型。这些模 型通常基于 Transformer[3] 架构,通过自监督的方 法从大量数据中进行学习,不仅拥有卓越的通用能 力,也可以适应不同的下游任务。通过扩展,模型 在多个领域展示出强大能力的同时,甚至可以涌现 出 的 新 能 力 。 例 如 基 于 GPT (Generative Pretrained Transformer)[4] 系列技术的 ChatGPT 对话机 器人,可以经过一定的提示词,在如机器翻译、情 感分析、文本摘要等大量的自然语言处理任务中表 现出色,亦可以推理小模型无法处理的复杂逻辑。 大模型一般使用自监督 (Self-supervised) 的方式 进行大规模的训练,然后将模型应用于不同的下游 任务。自监督的学习方式摆脱了对大量人工标记的 依赖。通过扩展模型的规模与训练量,模型的任务 范围与性能均能有显著提高,同时微调 (Fine-tun‐ ing) 也可以在特定任务上利用少量数据快速提升 模型能力。在大模型中,以语言大模型 (Large Language Models, LLMs)[5] 为代表性成果,其可以 通过一定的提示词完成广泛的文本生成任务,展现 出强大的模型泛化能力。大模型也包括视觉大模型 (Large Vision Models, LVMs) 与 多 模 态 大 模 型 (Large Multi-modal Models, LMMs) 等。 现代农业的迅猛发展与人工智能技术进步密切相关,特别是深度学习的突破性进展对农业产生了 深远影响。深度学习强大的特征学习与数据处理等 能力,使其在杂草控制、作物病虫害检测、畜牧业 管理以及农业遥感等领域均有广泛应用。然而,这 些方法大多使用监督学习,依赖于特定的高质量人 工标注数据。收集和标注这类数据集不仅耗时、耗 资巨大,且模型迁移到其他任务的能力有限,限制 了数据规模与模型的发展。因此,寻找能够跨应用 领域通用的模型和技术,减少对大规模数据标记的 新方法,扩展深度学习框架的通用性,是推动农业 等领域进步的重要挑战。农业大模型 (Agricultural Big Models) 是为克服上述困难的一次重大尝试, 为解决农业领域数据较少且分散的现状提供了方 案,同时其广泛的任务迁移能力也得到了多个农业 子领域的关注。图 1介绍了大模型的构建流程,包 含使用异构数据训练模型,对模型微调提升能力, 以及使用外部系统增强生成能力等;最终,模型可 以用于多种农业综合服务中,提供强大而全面的农 业问题解决方案。