标题: 错误有用：使用验证辅助迭代提示的指令引导任务编程摘要: 从高级自然语言指令生成低级机器人任务计划仍然是一个具有挑战性的问题。虽然大型语言模型已经在生成计划方面显示出了良好的效果，但输出的准确性仍未得到验证。此外，缺乏特定领域的语言数据限制了这些模型的应用范围。在本文中，我们提出了CLAIRIFY，一种新颖的方法，它将自动迭代提示与程序验证相结合，以确保使用数据稀缺的特定领域语言编写的程序在语法上有效，并满足环境约束。我们的方法为语言模型在生成类似结构的任务计划方面提供了有效的指导，并将任何错误作为反馈进行处理，同时验证器可确保生成的计划的语法准确性。我们通过实现最新技术，以规划化学实验为例，展示了CLAIRIFY的有效性。我们还展示了生成的计划可与任务和运动规划器集成，以便在实际机器人上执行。 (Errors are Useful Prompts: Instruction Guided Task Programming with Verifier-Assisted Iterative Prompting)

翻译：标题: 错误有用：使用验证辅助迭代提示的指令引导任务编程摘要: 从高级自然语言指令生成低级机器人任务计划仍然是一个具有挑战性的问题。虽然大型语言模型已经在生成计划方面显示出了良好的效果，但输出的准确性仍未得到验证。此外，缺乏特定领域的语言数据限制了这些模型的应用范围。在本文中，我们提出了CLAIRIFY，一种新颖的方法，它将自动迭代提示与程序验证相结合，以确保使用数据稀缺的特定领域语言编写的程序在语法上有效，并满足环境约束。我们的方法为语言模型在生成类似结构的任务计划方面提供了有效的指导，并将任何错误作为反馈进行处理，同时验证器可确保生成的计划的语法准确性。我们通过实现最新技术，以规划化学实验为例，展示了CLAIRIFY的有效性。我们还展示了生成的计划可与任务和运动规划器集成，以便在实际机器人上执行。

Marta Skreta,Naruki Yoshikawa,Sebastian Arellano-Rubach,Zhi Ji,Lasse Bjørn Kristensen,Kourosh Darvish,Alán Aspuru-Guzik,Florian Shkurti,Animesh Garg

Generating low-level robot task plans from high-level natural language instructions remains a challenging problem. Although large language models have shown promising results in generating plans, the accuracy of the output remains unverified. Furthermore, the lack of domain-specific language data poses a limitation on the applicability of these models. In this paper, we propose CLAIRIFY, a novel approach that combines automatic iterative prompting with program verification to ensure programs written in data-scarce domain-specific language are syntactically valid and incorporate environment constraints. Our approach provides effective guidance to the language model on generating structured-like task plans by incorporating any errors as feedback, while the verifier ensures the syntactic accuracy of the generated plans. We demonstrate the effectiveness of CLAIRIFY in planning chemistry experiments by achieving state-of-the-art results. We also show that the generated plans can be executed on a real robot by integrating them with a task and motion planner.

翻译：注意：特定领域语言的英文原文为 Domain-Specific Language。

相关内容

程序验证

关注 1

程序员从早期程序设计起，就面临要证明他们的程序达到某种预定目的的任务，这就是程序验证。早期计算机主要用于数学计算，人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广，程序验证的任务变得非常困难，这就导致了对基于测试的精巧技术的研究，即它基于计算机程序是一种人工制品，通过实验过程一定能揭示它的多种属性这种思想基础。程序员从早期程序设计起，就面临要证明他们的程序达到某种预定目的的任务，这就是程序验证。早期计算机主要用于数学计算，人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广，程序验证的任务变得非常困难，这就导致了对基于测试的精巧技术的研究，即它基于计算机程序是一种人工制品，通过实验过程一定能揭示它的多种属性这种思想基础。

ChatGP能生成，但搜索行么? 山大百度最新《将大型语言模型作为重排序代理进行研究》

专知会员服务

35+阅读 · 2023年4月20日

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

专知会员服务

104+阅读 · 2022年2月10日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日