AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能实 体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给 定目标的能力。AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果。而 AI Agent 的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。和传统的 RPA 相比,RPA 只能在给定的情况条件下,根据程序内预设好的流程来进行工作的处 理,而 AI Agent 则可以通过和环境进行交互,感知信息并做出对应的思考和行动。
大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型庞大的训练数据集中包含了大量人类行为数据,为模拟类 人的交互打下了坚实基础;另一方面,随着模型规模不断增大,大模型涌现出了上 下文学习能力、推理能力、思维链等类似人类思考方式的多种能力。将大模型作为 AI Agent 的核心大脑,就可以实现以往难以实现的将复杂问题拆解成可实现的子任 务、类人的自然语言交互等能力。由于大模型仍存在大量的问题如幻觉、上下文容 量限制等,通过让大模型借助一个或多个 Agent 的能力,构建成为具备自主思考决 策和执行能力的智能体,成为了当前通往 AGI 的主要研究方向。
一个基于大模型的 AI Agent 系统可以拆分为大模型、规划、记忆与工具使用四个组 件部分。AI Agent 可能会成为新时代的开端,其基础架构可以简单划分为 Agent = LLM + 规划技能 + 记忆 + 工具使用,其中 LLM 扮演了 Agent 的“大脑”,在这个 系统中提供推理、规划等能力。
AI Agent 发展迅速,出现多款“出圈”级研究成果。2023 年 3 月起,AI Agent 领 域迎来了第一次“出圈”,西部世界小镇、BabyAGI、AutoGPT 等多款重大 Agent 研究项目均在短短两周内陆续上线,引发了大家对 AI Agent 领域的关注。目前已经 涌现了在游戏领域大放异彩的英伟达 Voyager 智能体、能够帮助个人完成简单任务 的 Agent 助理 HyperWrite、以及主打个人情感陪伴的 AI 助理 Pi 等多款优秀的 Agent 成果,AI Agent 的研究进展迅速。
“Agent+”有望成为未来产品的主流,有望在多个领域实现落地应用。我们认为, AI Agent 的研究是人类不断探索接近 AGI 的过程,随着 Agent 变得越来越“可用” 和“好用”,“Agent+”的产品将会越来越多,未来将有望成为 AI 应用层的基本架 构,包括 to C、to B 产品等。
2B 和垂直领域仍是 AI Agents 容易率先落地的方向,用户对 Agent 的认知正在形 成,初创企业正在卡位。由于 Agent 对环境反馈的依赖性较强,具备显著特点的企 业环境是更加适合 Agent 建立起对某一个垂直领域认知的场景。当前关于 AI Agent 的研究主要还是以学术界和开发者为主,商业化产品极少,但是用户对于 Agent 的 关注度正在提升,可能未来几年间就会涌现出大量以 Agent 作为核心的产品应用到 各行各业。目前,已经有一些初创公司开始以企业的智能体平台作为主要的产品研 发方向,例如澜码科技正在打造基于 LLM 的企业级 Agent 平台。