随着大语言模型(LLMs)的最新进展,智能体人工智能(Agentic AI)在现实世界应用中变得愈发显著,逐渐向基于多LLM的智能体发展,使其能够感知、学习、推理并协同行动。这些基于LLM的多智能体系统(MASs)使得一组智能体能够协调并大规模地共同解决复杂任务,从孤立的模型转向以协作为核心的方法。本文对MASs的协作方面进行了广泛综述,并引入了一个可扩展的框架以指导未来研究。我们的框架基于关键维度对协作机制进行了分类:参与者(涉及的智能体)、类型(如合作、竞争或竞合)、结构(如点对点、集中式或分布式)、策略(如基于角色或基于模型)以及协调协议。通过对现有方法的回顾,我们的研究结果为揭示和推进基于LLM的MASs提供了基础,旨在为复杂的现实世界用例提供更智能和协作的解决方案。此外,本文还探讨了MASs在多个领域的广泛应用,包括5G/6G网络、工业5.0、问答系统以及社会和文化场景,展示了其广泛采用和深远影响。最后,我们总结了关键经验教训、开放挑战以及MASs在实现人工集体智能方面的潜在研究方向。 https://arxiv.org/pdf/2501.06322

**1.1 研究动机

近年来,大语言模型(LLMs)的进展彻底改变了人工智能(AI)领域,使其能够执行复杂的任务,如创意写作、推理和决策,甚至在某些方面可与人类水平相媲美 [156]。然而,尽管这些模型在个体层面展现了卓越的能力,它们仍存在一些固有局限性,例如幻觉问题 [57]、自回归特性(如无法进行慢思考 [49])以及扩展规律 [55, 69]。为了解决这些挑战,智能体人工智能(Agentic AI)将LLMs作为“大脑”或“协调者”,将其与外部工具和议程(如规划)相结合,使基于LLM的智能体能够采取行动、解决复杂问题,并与外部环境进行学习和交互 [1,2]。此外,研究人员越来越多地探索水平扩展——利用多个基于LLM的智能体协同工作,以实现集体智能。这种方法与多智能体系统(MASs)和协作AI的研究方向一致,后者专注于使智能体群体能够协调、共享知识并共同解决问题。这些领域的融合催生了基于LLM的MASs,它们利用多个LLM的集体智能来应对复杂的多步骤挑战 [118]。MASs的灵感不仅来自技术进步,还源于人类集体智能(如“心智社会” [87]、“心智理论” [45])。人类社会擅长通过团队合作和专业化实现共同目标,从日常任务到科学发现皆是如此。类似地,MASs旨在模拟这些原则,使AI智能体能够通过结合各自的优势和视角进行有效协作。基于LLM的MAS可以具有多种不同特性的协作渠道,如图1所示。MASs在各个领域取得了显著成功,通过利用专业智能体之间的协作和协调,增强了个体LLM的能力。这些系统在智能体之间分配任务,使智能体能够共享知识、执行子任务,并将其努力与共同目标对齐。MASs的潜在益处是变革性的。它们在知识记忆方面表现出色,使分布式智能体能够保留和共享多样化的知识库,而不会使单个系统过载 [51, 154]。它们通过将任务分配给多个智能体来增强长期规划能力,支持在长期交互中持续解决问题 [58]。此外,MASs通过汇集具有专门提示/角色的多个模型的专业知识,实现了有效的泛化,使其能够比独立模型更有效地解决多样化问题。最后,MASs通过同时管理由专业智能体处理的子任务,提高了交互效率,加速了复杂多步骤任务的解决。MAS致力于实现集体智能,即多个智能体的综合能力超越其个体贡献的总和 [24]。有效MASs的一个主要关注点是协作机制 [33, 74, 75, 97, 132],这些机制推动了从传统的孤立模型向强调交互的方法的转变,使智能体能够连接、协商、决策、规划并共同行动,从而在集体环境中推动AI能力的提升。深入了解协作机制在MASs中的运作方式,对于释放其全部潜力至关重要。

**1.2 研究现状与贡献

由于基于LLM的多智能体协作系统的重要性和迫切需求,已有一些关于该主题的综述。然而,这些工作往往未能全面探讨基于LLM的MASs的协作方面和机制,而这些对于使智能体能够有效实现共同目标至关重要,如表1所总结。例如,[47, 107, 136] 主要关注单智能体系统,仅浅显地涉及多智能体协作。[136] 提出了一个基于LLM的智能体框架,包括三个组件:大脑、感知和行动。他们的工作强调了将LLMs作为智能体的“大脑”,利用输入模态集成、提示、检索和工具使用等技术。然而,他们对多智能体协作的讨论仅限于智能体行为和个性,缺乏对使智能体协同工作的机制的深入探讨。[47] 调查了基于LLM的MASs成功应用的领域和场景,分析了这些系统的通信结构(分层、去中心化、集中式和共享消息池),但未涉及协作的其他特征,如类型、策略或协调架构。其他工作,如[82],专注于协作策略,将其分类为合并、集成和合作。尽管他们的综述讨论了这些策略如何应用于LLMs,并将合作扩展到传统融合技术之外,但忽略了其他关键的协作机制,如竞争和竞合,以及除流行协作类型之外的维度。相比之下,[120] 提出了一个通过MASs增强LLM能力的通用框架,展示了Auto-GPT等工具如何与其框架对齐。然而,协作机制仍停留在概念层面,缺乏详细的实现和特征描述。[50] 的重点是配置LLMs以利用多样化的能力和角色,例如集成记忆和信息检索组件。他们对多智能体协作的探索主要集中在规划和协调架构上,强调基于智能体角色和专业化的全局和局部任务规划。与此同时,[46] 将其研究范围缩小到基于LLM的MASs在基于智能体的建模和模拟中的应用,讨论了环境感知、人类对齐、行动生成和评估等挑战。尽管对模拟特定应用具有启发性,但它缺乏对深入协作机制的更广泛视角。类似地,[68] 调查了这些系统在数字孪生中的应用,而[52, 70] 则专注于软件工程领域。从上述总结和解释中可以看出,现有研究在全面探索基于LLM的MASs的协作方面和机制方面存在明显不足,而这些对于使智能体能够共同实现目标至关重要。本文旨在提供基于LLM的智能体在多智能体协作系统中协作基础的全面视角。以协作为核心,我们的研究基于参与者(涉及的智能体)、类型(如合作、竞争或竞合)、结构(如点对点、集中式或分布式)、策略(如基于角色、基于规则或基于模型)以及协调层对智能体之间的协作进行了特征化。我们强调了促进有效协作的机制和关键技术,识别了MAS设计中的关键特征和趋势。通过对现有方法的综述和开放挑战的识别,我们将这些发现综合为一个连贯的框架。该框架为未来研究奠定了基础,推动了LLMs在MASs中的集成,并为开发更具适应性、智能性和协作性的AI系统铺平了道路,以应对复杂的现实世界应用。我们的主要贡献如下:

  • 基于LLM的MAS中的协作方面和机制:我们专注于基于LLM的多智能体协作的操作机制,强调实现有效协作所需的“技术诀窍”,包括协作类型、策略、通信结构和协调架构。
  • 基于LLM的MAS的通用框架:我们提出了一个综合框架,整合了MAS的多样化特征,使研究人员能够理解、设计和开发多智能体协作系统。
  • 现实世界应用的综述:我们研究了基于LLM的MASs在各个领域的实际应用,突出了其实际应用、成功案例和局限性。
  • 经验教训与开放问题的讨论:我们识别了MASs发展议程中的关键挑战,如集体推理和决策,并概述了解决这些挑战的潜在研究方向。

**1.3 论文结构

本文的结构如下:第2节提供了理解本工作所需的背景知识,包括LLMs、MASs和协作AI的概述。第3节通过数学符号介绍了基于LLM的多智能体协作系统的基础概念,强调了协作的关键作用。接着,第4节对基于LLM的多智能体协作系统进行了广泛综述,按协作的关键特征(包括类型、策略、结构和协调与编排)分类。第5节回顾了基于LLM的多智能体协作系统在学术界和工业界的关键应用。第6节讨论了这一新兴研究领域的开放问题和未来研究方向。最后,第7节总结了这篇关于基于LLM的多智能体协作系统的综述论文。

成为VIP会员查看完整内容
1

相关内容

多模态基础模型的机制可解释性综述
专知会员服务
23+阅读 · 2月28日
大规模语言模型在自动规划中的应用综述
专知会员服务
26+阅读 · 2月22日
基于大型语言模型的软件工程智能体综述
专知会员服务
47+阅读 · 2024年9月6日
《多模态大语言模型评估综述》
专知会员服务
34+阅读 · 2024年8月29日
自动驾驶中的多智能体强化学习综述
专知会员服务
41+阅读 · 2024年8月20日
大规模语言模型的人类偏好学习综述
专知会员服务
41+阅读 · 2024年6月19日
大语言模型的终身学习综述
专知会员服务
67+阅读 · 2024年6月15日
大型语言模型图表示学习:技术的全面综述
专知会员服务
51+阅读 · 2024年2月14日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
117+阅读 · 2024年2月6日
数据受限条件下的多模态处理技术综述
专知
17+阅读 · 2022年7月16日
综述| 当图神经网络遇上强化学习
图与推荐
32+阅读 · 2022年7月1日
多模态深度学习综述,18页pdf
专知
49+阅读 · 2020年3月29日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
437+阅读 · 2023年3月31日
Arxiv
22+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
多模态基础模型的机制可解释性综述
专知会员服务
23+阅读 · 2月28日
大规模语言模型在自动规划中的应用综述
专知会员服务
26+阅读 · 2月22日
基于大型语言模型的软件工程智能体综述
专知会员服务
47+阅读 · 2024年9月6日
《多模态大语言模型评估综述》
专知会员服务
34+阅读 · 2024年8月29日
自动驾驶中的多智能体强化学习综述
专知会员服务
41+阅读 · 2024年8月20日
大规模语言模型的人类偏好学习综述
专知会员服务
41+阅读 · 2024年6月19日
大语言模型的终身学习综述
专知会员服务
67+阅读 · 2024年6月15日
大型语言模型图表示学习:技术的全面综述
专知会员服务
51+阅读 · 2024年2月14日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
117+阅读 · 2024年2月6日
相关资讯
数据受限条件下的多模态处理技术综述
专知
17+阅读 · 2022年7月16日
综述| 当图神经网络遇上强化学习
图与推荐
32+阅读 · 2022年7月1日
多模态深度学习综述,18页pdf
专知
49+阅读 · 2020年3月29日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员