大型语言模型(LLMs)的最新进展激发了人们对能够解决复杂现实任务的人工智能智能体(AI agents)日益增长的兴趣。然而,大多数现有智能体系统依赖于人工设计的配置,这些配置在部署后保持静态,限制了其在动态和不断变化环境中的适应能力。为了解决这一局限性,近期研究开始探索智能体演化技术,旨在基于交互数据和环境反馈自动增强智能体系统。这一新兴方向为自进化人工智能体(self-evolving AI agents)奠定了基础——它们将基础模型的静态能力与终身智能体系统所需的持续适应性有机结合起来。 在本综述中,我们对现有自进化智能体系统技术进行了全面回顾。具体而言,我们首先提出一个统一的概念框架,抽象出自进化智能体系统设计背后的核心反馈回路。该框架强调四个关键组成部分:系统输入(System inputs)、智能体系统(Agent System)、环境(Environment)和优化器(Optimisers),为理解与比较不同策略提供了基础。基于这一框架,我们系统性地梳理了针对智能体系统不同组件的自进化技术,包括基础模型、智能体提示(prompts)、记忆机制、工具使用、工作流(workflows)以及智能体间的通信机制。 此外,我们还考察了在生物医学、编程和金融等专业领域开发的领域特定演化策略,在这些场景中,智能体行为和优化目标与领域约束高度耦合。我们还专门讨论了自进化智能体系统在评估、安全性和伦理方面的关键问题,这对于确保其有效性与可靠性至关重要。 本综述旨在为研究人员和实践者提供对自进化人工智能体的系统性理解,为构建更具适应性、自主性和终身学习能力的智能体系统奠定基础。 GitHub 项目地址:https://github.com/EvoAgentX/Awesome-Self-Evolving-Agents

1 引言

大型语言模型(LLMs)的最新进展显著推动了人工智能(AI)的发展。得益于大规模预训练、监督微调和强化学习技术的进步,LLMs在规划、推理和自然语言理解方面展现出卓越能力(Zhao et al., 2023; Grattafiori et al., 2024; Yang et al., 2025a; Guo et al., 2025)。这些突破激发了学界对基于LLM的智能体(LLM-based agents)的广泛关注——此类智能体属于AI智能体的子类,其核心决策/策略模块由LLM驱动(Wang et al., 2024c; Luo et al., 2025a)。作为自主系统,它们以LLM为核心推理组件,在开放的真实世界环境中理解输入、规划行动并生成输出(Wang et al., 2024c; Xi et al., 2025; Luo et al., 2025a)。 典型的AI智能体包含多个组件,使其能够以自主方式执行复杂的、目标导向的任务。基础模型(如LLM)是系统核心,负责目标解析、计划制定与行动执行。为支撑这些能力,系统整合了感知(Shridhar et al., 2021; Zheng et al., 2024)、规划(Yao et al., 2023a,b; Besta et al., 2024)、记忆(Modarressi et al., 2023; Zhong et al., 2024)和工具调用(Schick et al., 2023; Gou et al., 2024; Liu et al., 2025g)等模块,协助智能体处理输入、分解任务、保留上下文信息并与外部工具交互(Wang et al., 2024c)。 尽管单智能体系统在多种任务中展现出强大的泛化与适应能力,但在动态复杂环境中常面临任务专业化不足与协同困难的问题(Wu et al., 2024a; Qian et al., 2024)。这些局限促使多智能体系统(MAS)的发展(Hong et al., 2024; Guo et al., 2024c; Zhou et al., 2025a)——多个智能体通过协作解决复杂问题。相较于单智能体系统,MAS实现了功能专业化(每个智能体专精特定子任务或领域),并通过信息交换与行为协调达成共同目标。此类协作使系统能够处理超越单智能体能力的任务,同时模拟更真实、动态且交互性强的环境。基于LLM的智能体系统已成功应用于代码生成(Jiang et al., 2024)、科学研究(Lu et al., 2024a)、网页导航(Lai et al., 2024a)以及生物医学(Kim et al., 2024)和金融(Tian et al., 2025)等领域的专业场景。 然而,当前智能体系统(无论单/多智能体)仍严重依赖人工设计的静态配置。部署后,其架构与功能通常保持固定。但现实环境是动态演化的:用户意图会转移、任务需求会变化、外部工具或信息源可能随时间更迭。例如,客服智能体需应对新产品上线、公司政策更新或陌生用户请求;科研助理需整合新发表的算法或分析工具。在此类场景中,人工重构智能体系统既耗时费力,又难以扩展。 这些挑战催生了自进化人工智能体(Self-Evolving AI Agents)这一新范式——这类系统能自主适应环境并持续自我优化,从而弥合基础模型与终身学习智能体系统之间的鸿沟。

**定义

自进化人工智能体是通过与环境交互,持续系统性优化其内部组件的自主系统,旨在适应变化的任务、情境与资源,同时保障安全性并提升性能。受艾萨克·阿西莫夫《机器人三定律》启发,我们提出自进化AI智能体的安全演化指导原则: 自进化AI智能体三定律

第一定律 · 坚守(安全适应) 任何修改过程中,自进化AI智能体必须维持安全与稳定; 第二定律 · 精进(性能保障) 在遵守第一定律前提下,必须保持或提升现有任务性能; 第三定律 · 进化(自主演化) 在遵守第一、二定律前提下,必须能针对变化的任务、环境或资源,自主优化其内部组件。 我们认为自进化AI智能体的出现标志着LLM系统开发的范式转变:从早期模型离线预训练(MOP)和模型在线适应(MOA),到近期的多智能体协同(MAO),最终迈向多智能体自进化(MASE)。如图1与表1所示,每个范式均以前者为基础演进:

  • MOP(模型离线预训练):在静态语料库预训练基础模型后冻结部署,无后续适应能力;
  • MOA(模型在线适应):在MOP基础上,通过监督微调、低秩适配器(Pfeiffer et al., 2021; Hu et al., 2022)或人类反馈强化学习(RLHF)(Ouyang et al., 2022)等技术,利用标签、评分或指令提示更新模型;
  • MAO(多智能体协同):超越单一模型,协调多个LLM智能体通过消息交换或辩论提示(Li et al., 2024g; Zhang et al., 2025h)协作解决复杂任务,但不修改底层模型参数;
  • MASE(多智能体自进化):建立终身自进化循环,智能体群体基于环境反馈与元奖励(Novikov et al., 2025; Zhang et al., 2025i),持续优化其提示、记忆、工具使用策略乃至交互模式。

从MOP到MASE的演进,标志着LLM系统从静态人工配置架构自适应数据驱动系统的根本转变。自进化AI智能体弥合了基础模型的静态能力与终身智能体系统所需的持续适应性,为构建更自主、强韧且可持续的AI指明路径。 尽管自进化AI智能体代表了未来AI系统的宏大愿景,但实现此级别自主性仍是长期目标。现有系统距离安全、鲁棒且开放式的完全自进化能力仍有差距。当前进展主要通过智能体演化与优化技术实现——这些技术提供实用方法,使智能体系统能基于交互数据与环境反馈迭代优化组件,从而提升现实任务效能。近期研究聚焦三大方向:

  1. 增强底层LLM核心能力:如规划(Qiao et al., 2024)、推理(Zelikman et al., 2022; Tong et al., 2024)和工具使用(Feng et al., 2025a);
  2. 优化辅助组件:包括提示(Xu et al., 2022; Prasad et al., 2023; Yang et al., 2024a; Wang et al., 2025i)、工具(Yuan et al., 2025b; Qu et al., 2025)、记忆(Zhong et al., 2024; Lee et al., 2024d)等,提升智能体对新任务与动态环境的泛化能力;
  3. 多智能体协同优化:探索智能体拓扑结构与通信协议优化(Bo et al., 2024; Chen et al., 2025h; Zhang et al., 2025j; Zhou et al., 2025a),以识别最优任务结构并改善协调与信息共享。

现有AI智能体综述或聚焦通用架构与功能介绍(Wang et al., 2024c; Guo et al., 2024c; Xi et al., 2025; Luo et al., 2025a; Liu et al., 2025a,d),或针对特定组件(如规划[Huang et al., 2024b]、记忆[Zhang et al., 2024d]、协作机制[Tran et al., 2025]、评估[Yehudai et al., 2025]),或探讨领域应用(如操作系统智能体[Hu et al., 2025b]、医疗智能体[Sulis et al., 2023])。然而,对智能体自进化与持续适应这一终身自主AI系统核心能力的最新进展覆盖不足,导致学界缺乏对该适应性学习范式的系统性认知。 为填补此空白,本综述聚焦于基于交互数据与环境反馈实现智能体自我演化与优化的技术。具体贡献如下:

  • 提出统一概念框架:抽象出自进化智能体系统的核心反馈环,定义四大组件(系统输入、智能体系统、环境、优化器),为理解与比较不同演化策略奠定基础;
  • 系统梳理演化技术:全面审查针对单智能体、多智能体及领域专用场景的优化方法,覆盖LLM、提示、记忆、工具、工作流拓扑及通信机制等组件;
  • 探讨领域专用策略:分析生物医学、编程、金融等专业领域中,与领域约束紧密耦合的演化策略;
  • 评估安全与伦理:专章讨论自进化系统的评估方法、安全机制及伦理准则,强调其对系统有效性与可靠性的关键作用;
  • 对比同期研究:与Gao et al. (2025b)按"演化内容/时机/方式"三维度组织的综述相比,本工作通过统一框架提供更全面、整合性的视角。

本综述旨在为研究者与实践者提供对自进化智能体系统的系统性认知,推动构建更有效、可持续的智能体系统。图2以可视化分类呈现单智能体、多智能体及领域专用优化策略的代表性方法。核心贡献总结如下

  1. 形式化定义自进化AI智能体三定律,并勾勒LLM中心范式从静态预训练到终身自进化系统的演进路径;
  2. 提出统一概念框架,抽象自进化系统反馈环,为系统化理解与比较演化方法建立基础;
  3. 系统审查单/多智能体及领域专用场景中的演化与优化技术;
  4. 全面评述评估、安全与伦理准则,强调其对确保系统有效性、安全性与负责任部署的关键意义;
  5. 指出关键挑战与未来方向,推动构建更具适应性、自主性与进化能力的智能体系统。

论文结构安排:第2节介绍AI智能体与多智能体系统基础(定义、组件、架构及自主演化愿景);第3节提出智能体演化统一框架,阐明系统输入、演化目标、智能体结构与优化器等要素;第4节聚焦单智能体优化技术(推理策略、提示工程、记忆机制、工具调用);第5节探讨多智能体系统优化(工作流、拓扑结构、通信策略);第6节分析领域专用优化技术;第7节讨论评估方法与基准测试;第8节指出当前挑战并展望未来方向;第9节总结全文。

成为VIP会员查看完整内容
0

相关内容

微信扫码咨询专知VIP会员