为了使机器人能够在家庭、办公室、厨房等多样化的自然环境中协助完成日常任务,关键在于开发能够在未见场景中泛化到新任务的策略。出于实用考虑,这些策略应能直接根据自然的任务描述(如语言指令)执行任务,而无需在测试时进行特定任务的适配。此外,这类策略应能够处理广泛的任务类型——例如操作可动关节物体、倒液体、重新定位物体和擦拭桌面等——而不需要像端到端模仿学习的主流范式那样,为每一个可能的任务都采集专门的机器人数据。由于在自然环境中收集大规模、多样化的机器人交互数据十分困难,因此这一要求并不现实。 虽然现有方法通常依赖大量示范数据来实现泛化,但本论文提出了有效利用网络数据来大规模扩展机器人交互数据集的方法。本文开创性地提出了一个新范式:通过将从大规模视频数据集中训练出的预测模型中的运动线索作为条件,显式地引导机器人策略,从而使策略能够执行包含新对象与新动作的任务,这些对象和动作在机器人专属数据中是未曾见过的。 我们在理论上形式化了将机器人策略因式分解的思想,即将其拆解为对具体身体结构无关的交互计划(可借助通用互联网数据进行训练),以及依赖具体身体结构执行的动作控制(在交互计划的条件下进行),后者相比之下是更容易解决的问题。贯穿全文,我们开发了基于通用目标/语言条件的策略,这些策略无需依赖特定任务或场景的启发式规则,即可完成多种任务。

成为VIP会员查看完整内容
1

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NTU博士论文】让语言模型更接近人类学习者
专知会员服务
18+阅读 · 5月3日
【CMU博士论文】基于课程学习的鲁棒强化学习
专知会员服务
18+阅读 · 3月27日
【伯克利博士论文】开放世界机器人之基础模型路径
专知会员服务
36+阅读 · 2024年8月13日
【伯克利博士论文】机器人机械搜索的操作与感知策略
专知会员服务
15+阅读 · 2022年6月4日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
【AI与医学】多模态机器学习精准医疗健康
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
Arxiv
169+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
168+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
微信扫码咨询专知VIP会员