【伯克利博士论文】在大规模语言模型时代构建自主系统

构建能够推理、适应并与环境互动的智能自主系统一直是人工智能的长期目标。

本文探讨了通过深度学习革命，代理系统（agentic systems）的演变，从强化学习到现代大规模语言模型（LLMs），重点关注构建可靠自主智能体所需的关键组件。首先，我们解决了深度强化学习（RL）中的普适性（generalization）这一根本挑战，提出了一种系统框架，用于评估和改进学习策略在不同环境之间的迁移能力。以此为基础，我们提出了事后任务重标定（Hindsight Task Relabeling, HTR），这是一种创新方法，使得元强化学习算法能够在稀疏奖励设置中学习适应策略，而不需要在训练过程中依赖密集的奖励信号。最后，我们讨论了利用大规模语言模型（LLMs）构建可靠智能体的最新挑战。尽管LLMs展示了前所未有的推理能力，但它们作为自主智能体的有效性受到其架构中的基本限制的制约——尤其是它们的无状态特性和固定的上下文窗口。为此，我们提出了MemGPT，一个受操作系统启发的框架，使得LLMs能够管理自己的记忆和状态，引入了虚拟上下文管理和自我导向的记忆操作等概念。MemGPT证明了，通过将LLMs视为一种新的计算基本单元——类似于CPU在传统操作系统中的角色——我们能够构建更可靠、更强大的自主智能体。综上所述，这些系统追溯了代理AI系统的发展，并提供了创建更可靠、更强大自主智能体的关键构建块。通过解决普适性、适应性和记忆管理等核心挑战，本文为工程化下一代能够有效推理并与世界互动的AI系统奠定了基础。

成为VIP会员查看完整内容

相关内容

博士论文

关注 116

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【博士论文】理解特征学习中的训练与适应：从两层网络到基础模型

专知会员服务

25+阅读 · 1月10日

【CMU博士论文】适应结构与利用结构进行适应：探索现代深度学习成功的原因

专知会员服务

26+阅读 · 2024年12月2日

【阿姆斯特丹博士论文】探索低资源神经机器翻译的解决方案

专知会员服务

13+阅读 · 2024年11月28日

【ETHZ博士论文】二维和三维生成模型在现实世界约束下

专知会员服务

17+阅读 · 2024年9月25日