大型语言模型(LLMs,或称为加强版的n-gram模型),最初被训练用于通过反复预测上下文中前一系列词语之后的下一个词来生成文本,已经吸引了AI(以及全世界)社区的注意。部分原因是它们能够为几乎所有人类智力活动领域的提示生成有意义的完成。这种极端的多功能性也导致了人们声称这些预测文本完成系统可能具备抽象推理和规划的能力。在这个教程中,我们将批判性地审视LLMs在规划任务中的帮助能力——无论是在自主模式下,还是在辅助模式下。我们特别感兴趣的是,在AI规划社区广泛研究的问题和框架上下文中,描述这些能力(如果有的话)。 https://yochan-lab.github.io/tutorial/LLMs-Planning/index.html

本教程将指出LLMs在生成通常需要通过组合搜索解决子目标交互的计划时的根本限制,并展示LLMs作为补充技术与AI规划社区开发的可靠规划器的建设性用途。除了介绍我们在这一领域的工作,我们还提供了许多相关努力的批判性综述,包括规划社区之外的研究人员的工作。 The preliminary list of topics to be covered in this tutorial includes: 1. Background on LLMs, and patterns of LLM use–including prompting techniques 1. Differentiating the use of transformer architectures vs. Pre-trained LLMs in planning

Mention Word2vec to plan, decision transformers, Our work on using GPT2 with fine tuning , learning verifiers 1. LLMs & Planning - Autonomous mode

Prompting in natural language or direct PDDL; effect of fine tuning; chain-of-thought prompting etc. * Limitation of self-critiquing and verification abilities of LLMs in reasoning/planning. 1. LLMs as heuristics/idea generators for planning

Connections to Case-Based and Model-Lite planning 1. Search by Back-prompting LLMS

Automated vs. Human-driven back-prompts (and the Clever Hans problem with the latter) 1. LLMs as model acquisition techniques 1. LLMs as vehicles to support general types of planning

Incompletely specified (highly disjunctive) goals; HTN planning; “generalized planning” * Use of LLMs in RL settings (to get rewards, preferences)

成为VIP会员查看完整内容
72

相关内容

《检索增强语言模型》最新教程,133页ppt
专知会员服务
61+阅读 · 3月11日
【EMNLP2023教程】自然语言生成,249页ppt
专知会员服务
59+阅读 · 2023年12月9日
【RecSys 2023教程】大型语言模型推荐,101页ppt
专知会员服务
69+阅读 · 2023年11月12日
【ICAPS 2023】关于大型语言模型在规划中的作用
专知会员服务
69+阅读 · 2023年7月17日
UIUC-Gargi《增强型语言模型》,64页ppt与视频
专知会员服务
36+阅读 · 2023年5月12日
【COMPTEXT2022教程】跨语言监督文本分类,41页ppt
专知会员服务
17+阅读 · 2022年6月14日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
专知会员服务
29+阅读 · 2021年10月17日
【GPT-3作者亲解】超大型语言模型少样本学习,109页ppt
专知会员服务
107+阅读 · 2020年12月19日
【干货书】计算机科学离散数学,627页pdf
专知
60+阅读 · 2020年8月31日
【KDD2020】图神经网络:基础与应用,322页ppt
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
《检索增强语言模型》最新教程,133页ppt
专知会员服务
61+阅读 · 3月11日
【EMNLP2023教程】自然语言生成,249页ppt
专知会员服务
59+阅读 · 2023年12月9日
【RecSys 2023教程】大型语言模型推荐,101页ppt
专知会员服务
69+阅读 · 2023年11月12日
【ICAPS 2023】关于大型语言模型在规划中的作用
专知会员服务
69+阅读 · 2023年7月17日
UIUC-Gargi《增强型语言模型》,64页ppt与视频
专知会员服务
36+阅读 · 2023年5月12日
【COMPTEXT2022教程】跨语言监督文本分类,41页ppt
专知会员服务
17+阅读 · 2022年6月14日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
专知会员服务
29+阅读 · 2021年10月17日
【GPT-3作者亲解】超大型语言模型少样本学习,109页ppt
专知会员服务
107+阅读 · 2020年12月19日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员