大型语言模型(LLMs,或称“超级n-gram模型”)最初是通过在先前词窗口的上下文中反复预测下一个词来生成文本的,这一特性引起了人工智能(以及整个世界)社区的关注。部分原因在于它们能够为几乎任何领域的人类智力活动生成有意义的完成。这种多功能性也导致了这些预测文本完成系统可能具备抽象推理和规划能力的说法。在本教程中,我们批判性地审视LLMs在规划任务中的帮助能力——无论是在自主模式还是辅助模式下。我们特别关注在广泛研究的AI规划社区的问题和框架中,LLMs是否具备这些能力。
教程将指出LLMs在生成通常需要通过组合搜索来解决子目标交互的计划时的基本限制,同时也展示LLMs作为AI规划社区开发的健全规划器的互补技术的建设性用途。除了展示我们在该领域的工作外,我们还对许多相关研究进行了批判性综述,包括规划社区以外的研究人员的努力。 * LLMs背景知识及其使用模式——包括提示技术 * 区分transformer架构与预训练LLMs在规划中的使用 * 提及Word2vec在规划中的应用,决策transformer,我们在使用GPT-2进行微调方面的工作,以及学习验证器 * LLMs与规划——自主模式
使用自然语言或直接PDDL提示的效果;微调的影响;链式思维提示等 * LLMs在推理/规划中的自我批判和验证能力的局限性 * LLMs作为规划的启发式/创意生成器 * 与基于案例和轻模型规划的联系 * 通过反向提示LLMs进行搜索
自动化与人类驱动的反向提示(以及后者中的聪明汉斯问题) * LLMs作为模型获取技术 * LLMs作为支持通用类型规划的工具
不完全指定的(高度析取的)目标;HTN规划;“广义规划” * 在强化学习环境中使用LLMs(获取奖励、偏好)