【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力 - 专知VIP

会员服务 ·

4

机器人 · 机器人系统 · 博士论文 ·

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

如何构建通用机器人系统？观察视觉和语言等领域，其共同主题是通过大规模、精心策划的数据集进行端到端学习。然而，在机器人技术中，仅靠规模可能不足以应对机器人任务的多模态性、缺乏易于获取的数据以及在物理硬件上部署的安全性和可靠性挑战。与此同时，当今一些最成功的机器人系统本质上是模块化的，能够利用每个模块的独立泛化能力来表现优异。受这些特性的启发，本论文旨在通过将这些组件整合为一个整体来解决构建通用机器人代理的任务：将模块化与大规模学习相结合，以实现通用机器人控制。我们首先独立探讨这两个方面。第一个问题是：如何在学习系统中构建模块化和层次结构？我们的关键见解是，与其让代理端到端地学习层次结构和低级控制，不如通过规划显式地强制模块化，从而实现更高效、能力更强的机器人学习。接下来，我们探讨规模在构建通用机器人系统中的作用。为了有效扩展，神经网络需要大量多样化数据、适应数据的表达性架构以及生成数据的监督来源。为此，我们利用一种强大的监督来源：经典规划算法，这些算法可以广泛泛化，但运行成本高，并且需要访问完美的特权信息才能在实践中表现良好。我们使用这些规划算法在模拟中监督大规模策略学习，以生成通用代理。最后，我们考虑如何将模块化与大规模策略学习统一起来，以构建能够执行零样本长期操作的自主现实世界机器人系统。我们提出通过紧密集成模块化高层和中层规划、学习的局部控制、程序化场景生成以及用于模拟到现实迁移的大规模策略学习的关键要素来实现这一目标。我们证明，这种方法可以产生强大的结果：一个单一的通用代理可以仅通过文本指令解决现实世界中具有挑战性的长期操作任务。https://arxiv.org/abs/2503.06814

成为VIP会员查看完整内容

7

相关内容

机器人

机器人（英语：Robot）包括一切模拟人类行为或思想与模拟其他生物的机械（如机器狗，机器猫等）。狭义上对机器人的定义还有很多分类法及争议，有些电脑程序甚至也被称为机器人。在当代工业中，机器人指能自动运行任务的人造机器设备，用以取代或协助人类工作，一般会是机电设备，由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

专知会员服务

16+阅读 · 3月9日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

30+阅读 · 2月21日

【NTU博士论文】数据高效的深度多模态学习

【NTU博士论文】数据高效的深度多模态学习

专知会员服务

18+阅读 · 1月31日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

18+阅读 · 2024年11月29日

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

专知会员服务

26+阅读 · 2024年10月29日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

28+阅读 · 2024年8月23日

【CMU博士论文】经典方法对现代机器学习的改进

【CMU博士论文】经典方法对现代机器学习的改进

专知会员服务

26+阅读 · 2024年8月16日

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

专知会员服务

28+阅读 · 2024年8月15日

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

专知会员服务

19+阅读 · 2024年8月13日

【ETHZ博士论文】用生成式语言模型加速分子发现

【ETHZ博士论文】用生成式语言模型加速分子发现

专知会员服务

31+阅读 · 2023年6月4日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知

14+阅读 · 2020年4月6日

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

专知

25+阅读 · 2019年11月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

目标检测101：一文带你读懂深度学习框架下的目标检测

目标检测101：一文带你读懂深度学习框架下的目标检测

大数据文摘

23+阅读 · 2017年9月27日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于移动雾节点的传感云关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据背景下的商业模式创新机制研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

200+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

439+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

158+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

77+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

VIP会员

相关主题

机器人系统

相关VIP内容

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

专知会员服务

16+阅读 · 3月9日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

30+阅读 · 2月21日

【NTU博士论文】数据高效的深度多模态学习

【NTU博士论文】数据高效的深度多模态学习

专知会员服务

18+阅读 · 1月31日

【ETHZ博士论文】与多机器人系统的直观与高效互动

【ETHZ博士论文】与多机器人系统的直观与高效互动

专知会员服务

18+阅读 · 2024年11月29日

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

专知会员服务

26+阅读 · 2024年10月29日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

28+阅读 · 2024年8月23日

【CMU博士论文】经典方法对现代机器学习的改进

【CMU博士论文】经典方法对现代机器学习的改进

专知会员服务

26+阅读 · 2024年8月16日

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

【MIT博士论文】优化与现代机器学习的融合：理论、计算与医疗应用

专知会员服务

28+阅读 · 2024年8月15日

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

专知会员服务

19+阅读 · 2024年8月13日

【ETHZ博士论文】用生成式语言模型加速分子发现

【ETHZ博士论文】用生成式语言模型加速分子发现

专知会员服务

31+阅读 · 2023年6月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《士兵职业路径规划：美国陆军学员司令部兵种预测模型（含代码）》180页

美海军部《海军MOSA实施指南v1》最新39页报告

美国陆军：人工智能与任务式指挥

《复杂环境导航：针对军事A2AD与民用避障的最短路径算法比较研究》133页

相关资讯

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知

14+阅读 · 2020年4月6日

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

专知

25+阅读 · 2019年11月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

目标检测101：一文带你读懂深度学习框架下的目标检测

目标检测101：一文带你读懂深度学习框架下的目标检测

大数据文摘

23+阅读 · 2017年9月27日

相关基金

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于移动雾节点的传感云关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据背景下的商业模式创新机制研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

200+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

439+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

158+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

77+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员