双级规划学习神经-双循环关系过渡模式 (Learning Neuro-Symbolic Relational Transition Models for Bilevel Planning)

Despite recent, independent progress in model-based reinforcement learning and integrated symbolic-geometric robotic planning, synthesizing these techniques remains challenging because of their disparate assumptions and strengths. In this work, we take a step toward bridging this gap with Neuro-Symbolic Relational Transition Models (NSRTs), a novel class of transition models that are data-efficient to learn, compatible with powerful robotic planning methods, and generalizable over objects. NSRTs have both symbolic and neural components, enabling a bilevel planning scheme where symbolic AI planning in an outer loop guides continuous planning with neural models in an inner loop. Experiments in four robotic planning domains show that NSRTs can be learned after only tens or hundreds of training episodes, and then used for fast planning in new tasks that require up to 60 actions to reach the goal and involve many more objects than were seen during training. Video: https://tinyurl.com/chitnis-nsrts

翻译：尽管最近在基于模型的强化学习和综合象征性地球测量机器人规划方面取得了独立进展,但综合这些技术仍因其不同的假设和长处而具有挑战性。在这项工作中,我们迈出了一步,以弥补与Neuro-Symblic 关系过渡模型(NSRTs)(NSRTs)的这一差距。 Neuro-Symblical 关系过渡模型(NSRTs)是一个新型的过渡模型,它具有数据效率,可以学习,与强大的机器人规划方法相兼容,而且可以普遍适用。NSRTs具有象征和神经两个部分,使得双级规划计划能够使外部循环中象征性的AI规划能够指导内循环中神经模型的连续规划。四个机器人规划领域的实验表明,在经过数万或数百次培训之后,可以学习NSRTs,然后用于快速规划新任务,这些新任务需要多达60项行动才能实现目标,而且涉及比培训期间看到的更多的物体。视频:https://tinyurl.com/chitnis-norts。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

【斯坦福大学课程】2021年深度多任务学习与元学习，CS 330: Deep Multi-Task and Meta Learning

专知会员服务

110+阅读 · 2022年3月2日

AAAI2021 | 图神经网络的异质图结构学习，Heterogeneous Graph Structure Learning for Graph Neural Networks

专知会员服务

92+阅读 · 2021年1月20日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

122+阅读 · 2020年5月18日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日