导读 随着大语言模型的日趋成熟,各类基于大语言模型的 AI Agent 逐渐走入人们的视野。本文将梳理大语言模型 Agent 的相关知识点,并对大模型时代 AI Agent 的重要落地方向进行探讨。今天的介绍会围绕下面五点展开:
**01****LLM-based Agent **整体架构
大语言模型 Agent 的构成,主要分为以下 4 个模块: 1. ****画像模块:****主要描述 Agent 的背景信息下面介绍画像模块的主要内容和生成策略。(1)画像内容,主要基于 3 种信息:人口统计信息、个性信息和社交信息。(2)生成策略:主要采用 3 种策略来生成画像内容:
**2. **记忆模块:主要目的是记录 Agent 行为,并为未来 Agent 决策提供支撑(1)记忆结构
3. 规划模块
无需反馈的规划:大语言模型在做推理的过程中无需外界环境的反馈。这类规划进一步细分为三种类型:基于单路的推理,仅使用一次大语言模型就可以完整输出推理的步骤;基于多路的推理,借鉴众包的思想,让大语言模型生成多个推理路径,进而确定最佳路径;借用外部的规划器。 * 带有反馈的规划:这种规划方式需要外界环境提供反馈,而大语言模型需要基于环境的反馈进行下一步以及后续的规划。这类规划反馈的提供者来自三个方面:环境反馈、人类反馈和模型反馈。
4. 动作模块
动作目标:有些 Agent 的目标是完成某个任务,有些是交流,有些是探索。 * 动作生成:有些 Agent 是依靠记忆回想生成动作,有些是按照原有计划执行特定的动作。 * 动作空间:有些动作空间是工具的集合,有些是基于大语言模型自身知识,从自我认知的角度考虑整个动作空间。 * 动作影响:包括对环境的影响、对内在状态的影响,以及对未来新动作的影响。 以上是 Agent 的整体框架,更多内容可参考下述论文:Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhiyuan Chen, Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen:A Survey on Large Language Model based Autonomous Agents. CoRR abs/2308.11432 (2023)02****
**LLM-based Agent **重点&难点问题
当前大语言模型 Agent 的重点和难点问题主要包括: 1. 如何提升 Agent 的角色扮演能力Agent 最重要的功能是通过扮演某种角色,来完成特定的任务,或者完成各种各样的模拟,因此 Agent 的角色扮演能力至关重要。(1)Agent 角色扮演能力定义Agent 角色扮演能力分为两个维度:
2. 如何设计 Agent 记忆机制Agent 和大语言模型最大的不同在于,Agent 能够在环境中不断进行自我演化和自我学习;而这其中,记忆机制扮演了非常重要的角色。从 3 个维度来分析 Agent 的记忆机制:(1)Agent 记忆机制设计常见有以下两种记忆机制:
3. 如何提升 Agent 推理/规划能力(1)Agent 任务分解能力
4. 如何设计多 Agent 高效协同机制(1)多 Agents 合作机制
基于大语言模型的用户行为模拟智能体
下面会举几个 Agent 的实际案例。首先是基于大语言模型的用户行为模拟智能体。该智能体也是大语言模型智能体与用户行为分析相结合的早期工作。该工作中,每个 Agent 分为三个模块: 1. 画像模块对不同的 Agent 指定不同的属性,比如 ID、姓名、职业、年龄、兴趣以及特征等。 2. 记忆模块记忆模块包括三个子模块(1)感受记忆(2)短期记忆
基于大语言模型的多智能体软件开发
下一个 Agent 的例子是使用多 Agent 进行软件开发。这篇工作也是早期多Agent 合作的工作,其最主要的目的是利用不同 Agent 开发一款完整的软件。因此可将其看作一个软件公司,不同的 Agent 会扮演不同的角色:一部分 Agent 负责设计,包括 CEO、CTO、CPO 等角色;一部分Agent 负责编码,还有一部分 Agent 主要负责测试;此外,还会有一部分 Agent 负责撰写文档。这样,不同 Agent 负责不同的工作;最后再将 Agent 之间的合作机制,通过交流的方式进行协同和更新,最终完成一个软件完整的开发过程。05****
**LLM-based Agent **未来方向
大语言模型的 Agent 目前可以分为两大方向:
以上就是本次分享的内容,谢谢大家。
分享嘉宾
INTRODUCTION
陈旭博士
中国人民大学
**准聘副教授 **
陈旭,博士毕业于清华大学,于 2020 年加入中国人民大学。他的研究方向为推荐系统,强化学习,因果推断等。曾在 TheWebConf、AIJ、TKDE、SIGIR、WSDM、TOIS 等著名国际会议/期刊发表论文60余篇。曾共同主导构建推荐系统工具包“伯乐”,可解释推荐数据集 REASONER,以及基于大语言模型的推荐用户自主智能体仿真环境 RecAgent 等。他的研究成果曾获得 TheWebConf 2018 最佳论文提名奖、CIKM 2022 最佳资源论文 Runner Up 奖和 AIRS 2017 最佳论文奖。同时,他也曾荣获 CCF 自然科学二等奖(排名第二),ACM-北京新星奖(北京市三人)等。他的研究成果在多家企业落地,相关成果荣获华为“创新先锋”总裁奖。他主持/参与多项国家自然科学基金以及企业合作项目。