Generating low-level robot task plans from high-level natural language instructions remains a challenging problem. Although large language models have shown promising results in generating plans, the accuracy of the output remains unverified. Furthermore, the lack of domain-specific language data poses a limitation on the applicability of these models. In this paper, we propose CLAIRIFY, a novel approach that combines automatic iterative prompting with program verification to ensure programs written in data-scarce domain-specific language are syntactically valid and incorporate environment constraints. Our approach provides effective guidance to the language model on generating structured-like task plans by incorporating any errors as feedback, while the verifier ensures the syntactic accuracy of the generated plans. We demonstrate the effectiveness of CLAIRIFY in planning chemistry experiments by achieving state-of-the-art results. We also show that the generated plans can be executed on a real robot by integrating them with a task and motion planner.


翻译:注意:特定领域语言的英文原文为 Domain-Specific Language。

0
下载
关闭预览

相关内容

程序员从早期程序设计起,就面临要证明他们的程序达到某种预定目的的任务,这就是程序验证。早期计算机主要用于数学计算,人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广,程序验证的任务变得非常困难,这就导致了对基于测试的精巧技术的研究,即它基于计算机程序是一种人工制品,通过实验过程一定能揭示它的多种属性这种思想基础。程序员从早期程序设计起,就面临要证明他们的程序达到某种预定目的的任务,这就是程序验证。早期计算机主要用于数学计算,人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广,程序验证的任务变得非常困难,这就导致了对基于测试的精巧技术的研究,即它基于计算机程序是一种人工制品,通过实验过程一定能揭示它的多种属性这种思想基础。
百篇论文纵览大型语言模型最新研究进展
专知会员服务
69+阅读 · 2023年3月31日
专知会员服务
18+阅读 · 2021年9月13日
专知会员服务
32+阅读 · 2021年3月7日
IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning
NAACL 2022 | 基于Prompt的文本生成迁移学习
PaperWeekly
1+阅读 · 2022年8月31日
ACL‘22杰出论文:Prompt范式有bug!
夕小瑶的卖萌屋
2+阅读 · 2022年7月10日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
无监督元学习表示学习
CreateAMind
26+阅读 · 2019年1月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月15日
Arxiv
2+阅读 · 2023年5月10日
Arxiv
0+阅读 · 2023年5月10日
A Survey of Large Language Models
Arxiv
332+阅读 · 2023年3月31日
VIP会员
相关VIP内容
百篇论文纵览大型语言模型最新研究进展
专知会员服务
69+阅读 · 2023年3月31日
专知会员服务
18+阅读 · 2021年9月13日
专知会员服务
32+阅读 · 2021年3月7日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员