【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf - 专知VIP

会员服务 ·

14

CMU · 博士论文 · 持续学习 · 机器人学习 ·

2023 年 10 月 4 日

【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人类不断地适应我们周围的世界，让我们无缝地获取新技能和探索多样的环境。但是，当前的AI方法不能达到这种多功能性。相反，它们通常使用大量的数据集进行训练，并同时学习所有任务。然而，经过训练的模型在适应变化的上下文时有限的能力，并受到可用数据的限制。在机器人技术中，这一挑战尤为突出，因为真实世界的交互数据非常稀少。

相反，我们设想一个机器人能够从环境和人类互动中持续学习，快速获取新信息而不覆盖过去的知识，并能够适应用户的特定需求。

在这篇论文中，我们将持续学习应用于机器人技术，目标是启用关键能力，包括：将先前的信息应用于新设置，维护旧信息，保持学习新技能的能力，以及理解上下文。我们在两种学习模式下探索这些：持续的强化学习(CRL)，代理从经验中学习；以及持续的模仿学习(CIL)，它从演示中学习。

然而，许多障碍阻碍了进步，包括有限的开源资源、资源密集型基准和机器人技术的不实用指标。为了应对这些挑战，我们提出CORA（持续强化学习代理），一个带有基准、基线和指标的开源工具包，以增强CRL的可用性。CORA超越了灾难性遗忘，评估模型进行前向转移和泛化的能力。

在此基础上，我们引入SANE（自激活神经集合）来创建一个动态的可适应技能库。SANE的独立模块集合根据需要学习和应用技能，减少遗忘。我们在几个Procgen强化学习任务集上展示了这种方法。

然后，我们将SANE适应到一个物理机器人——Stretch，使用CIL并命名为SANER（SANE用于机器人技术）。借助我们创新的基于注意力的交互策略（ABIP），SANER在少次学习中表现出色，展示了其在各种任务中的泛化效果。 SANERv2进一步增强了这一能力，整合了自然语言，并在一个模拟环境RLBench中，在15个不同的操纵任务上实现了强大的性能。值得注意的是，SANERv2还能展示独立模块的潜力，证明一个节点可以在代理之间移动而不损失性能，这预示着未来可能有组合的集成。

成为VIP会员查看完整内容

28

相关内容

CMU

【KAUST博士论文】基于深度图神经网络的结构化智能研究，192页pdf

【KAUST博士论文】基于深度图神经网络的结构化智能研究，192页pdf

专知会员服务

47+阅读 · 2023年11月8日

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

专知会员服务

77+阅读 · 2023年10月23日

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

专知会员服务

71+阅读 · 2023年6月8日

【CMU博士论文】分布式强化学习自动驾驶，100页pdf

【CMU博士论文】分布式强化学习自动驾驶，100页pdf

专知会员服务

37+阅读 · 2023年4月17日

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

专知会员服务

30+阅读 · 2023年3月8日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【CMU博士论文】迈向高效自动机器学习，184页pdf

【CMU博士论文】迈向高效自动机器学习，184页pdf

专知会员服务

34+阅读 · 2023年2月24日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知会员服务

34+阅读 · 2022年8月6日

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

专知会员服务

26+阅读 · 2021年1月18日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究，126页pdf

【NUS博士论文】深度视觉算法的对抗鲁棒性研究，126页pdf

专知

1+阅读 · 2022年11月26日

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

专知

0+阅读 · 2022年11月25日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

高精度三维植物建模技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于BIM的建筑生命周期环境与经济评价及优化设计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

lifex-cfd: an open-source computational fluid dynamics solver for cardiovascular applications

Arxiv

0+阅读 · 2023年11月20日

edibble: An R package to encapsulate elements of experimental designs for better planning, management and workflow

Arxiv

0+阅读 · 2023年11月16日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

机器人学习

相关VIP内容

【KAUST博士论文】基于深度图神经网络的结构化智能研究，192页pdf

【KAUST博士论文】基于深度图神经网络的结构化智能研究，192页pdf

专知会员服务

47+阅读 · 2023年11月8日

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

【华盛顿大学博士论文】透明机器学习：理论与计算，521页pdf

专知会员服务

77+阅读 · 2023年10月23日

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

专知会员服务

71+阅读 · 2023年6月8日

【CMU博士论文】分布式强化学习自动驾驶，100页pdf

【CMU博士论文】分布式强化学习自动驾驶，100页pdf

专知会员服务

37+阅读 · 2023年4月17日

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

专知会员服务

30+阅读 · 2023年3月8日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【CMU博士论文】迈向高效自动机器学习，184页pdf

【CMU博士论文】迈向高效自动机器学习，184页pdf

专知会员服务

34+阅读 · 2023年2月24日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知会员服务

34+阅读 · 2022年8月6日

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

专知会员服务

26+阅读 · 2021年1月18日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

【苏黎世联邦理工博士论文】深度强化学习的体系结构，186页pdf

专知

6+阅读 · 2022年11月29日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究，126页pdf

【NUS博士论文】深度视觉算法的对抗鲁棒性研究，126页pdf

专知

1+阅读 · 2022年11月26日

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

专知

0+阅读 · 2022年11月25日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

相关基金

高精度三维植物建模技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于BIM的建筑生命周期环境与经济评价及优化设计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

lifex-cfd: an open-source computational fluid dynamics solver for cardiovascular applications

Arxiv

0+阅读 · 2023年11月20日

edibble: An R package to encapsulate elements of experimental designs for better planning, management and workflow

Arxiv

0+阅读 · 2023年11月16日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员