摘要——智能体时代已然来临,而这一变革的驱动力正是大语言模型的突破性进展。大语言模型(LLM)智能体凭借其目标驱动行为与动态适应能力,很可能成为通往通用人工智能的关键路径。本文通过方法论导向的体系化分类,系统解构LLM智能体系统,揭示其架构基础、协作机制与进化路径之间的深层关联。我们整合了当前零散的研究脉络,阐明智能体设计原则与其在复杂环境中涌现行为之间的本质联系。本研究提供了一种统一的架构视角,涵盖智能体的构建方式、协作机制与演化过程,同时探讨了评估方法、工具应用、现实挑战及多样化应用场景。通过梳理这一快速发展领域的最新进展,我们为研究者提供了理解LLM智能体的结构化分类体系,并指明了未来研究的潜在方向。本文集可通过
https://github.com/luo-junyu/Awesome-Agent-Papers获取。 **
**关键词——大语言模型,LLM智能体,AI智能体,智能代理,多智能体系统,LLM,文献综述 1 引言人工智能正迈入一个关键时代,其标志是**大语言模型智能体(LLM Agent)**的崛起——这些由大语言模型(LLMs)驱动的智能实体能够感知环境、推理目标并执行行动[1]。与传统AI系统仅被动响应用户输入不同,现代LLM智能体通过持续学习、推理和适应,主动与环境交互。这一转变不仅是技术升级,更是对人机关系的根本性重构。商用LLM智能体系统(如DeepResearch、DeepSearch和Manus)印证了此范式变革:它们能自主完成从深度研究到计算机操作等曾需人类专业知识的复杂任务,同时适配用户个性化需求。相较于传统智能体系统[2],基于LLM的智能体在知识来源[3]、泛化能力[4]和交互模式[5]等维度实现了代际跨越。当今智能体的质变源于三大关键进展的融合:❶ LLMs前所未有的推理能力[6],❷ 工具操控与环境交互技术的进步[7],以及❸ 支持长期经验积累的精密记忆架构[8][9]。这种融合将理论构想转化为实用系统,日益模糊"助手"与"协作者"的界限。其本质在于LLMs作为通用任务处理器,通过生成式架构在语义空间内统一感知、决策与行动,从而形成类人认知闭环[10]。本研究通过构建-协作-演化的统一分类框架,首次系统解构智能体系统。我们提供全景视角,追溯智能体的定义方式、独立/协同运作机制及长期进化路径。除厘清现状外,更揭示了预示未来发展的新兴范式。智能体技术的快速演进亟需及时综述,为研究者提供理解这一动态领域的最新分类体系。图1展示了我们设计的LLM智能体生态框架:以方法论为核心,我们从三个互相关联的维度分析智能体技术基础:构建(定义与实现方式)协作(交互与协同机制)演化(学习与优化路径)此三维基础辅以实践考量,包括评估方法、开发工具、安全与伦理等现实挑战,以及多样化应用场景。该框架贯穿全文,实现对每个维度的系统性探索及其关联性的强调。与既有综述的差异尽管近年有多篇AI智能体综述,本研究通过方法论聚焦与LLM智能体架构的全面分析做出独特贡献。既往研究或局限于特定应用(如游戏[11][12])、部署环境[13][14]、多模态[15]或安全[16],或仅提供宽泛概述而缺乏方法论分类[1][17]。近期工作虽对比了LLM与传统AI智能体[9]、多智能体交互[18]、工作流[19]及协作决策机制[20],但本研究的特色在于:方法论导向的分类体系:提出系统化分类法,从角色定义、记忆机制、规划能力到行动执行[21]解构LLM智能体核心组件。构建-协作-演化框架:通过三维度联动分析(构建/协作/演化),提供比既往研究[22][23]更整体的认知,凸显个体设计与协作系统的连续性——而前人常割裂讨论这些方面[22][24]。前沿应用与现实聚焦:除理论探讨外,深入剖析LLM智能体的尖端工具、通信协议及跨领域应用,并对安全、隐私与伦理等现实挑战进行全面分析。在智能体技术从研究迈向大规模落地的关键阶段,这一前瞻视角尤为重要。本综述为研究者和从业者提供结构化分类体系,助力从多视角理解、比较和推进LLM智能体研究。随着LLM智能体日益深入各关键领域,理解其架构基础不仅对学术界,对政策制定者、产业界乃至全社会都至关重要。本文旨在奠定这一基础,同时为这一快速演进领域指明发展方向。