Every home is different, and every person likes things done in their particular way. Therefore, home robots of the future need to both reason about the sequential nature of day-to-day tasks and generalize to user's preferences. To this end, we propose a Transformer Task Planner(TTP) that learns high-level actions from demonstrations by leveraging object attribute-based representations. TTP can be pre-trained on multiple preferences and shows generalization to unseen preferences using a single demonstration as a prompt in a simulated dishwasher loading task. Further, we demonstrate real-world dish rearrangement using TTP with a Franka Panda robotic arm, prompted using a single human demonstration.
翻译:每个家都不同,每个人都喜欢以特定方式完成的事情。 因此, 未来的家庭机器人既需要了解日常任务的顺序性质,也需要概括用户的偏好。 为此, 我们提议一个变换任务规划员(TTP), 通过利用基于对象属性的演示, 来从示威中学习高层次的行动。 TTP可以接受多重偏好的预先培训, 并展示对看不见偏好的概括化, 使用单一的演示作为模拟洗碗器装填装任务的提示。 此外, 我们展示真实世界的菜类重新布局, 使用富兰卡潘达机器人臂, 由单一的人类演示推动的 TTP 。