【CMU博士论文】强化学习的泛化灵巧性，182页pdf - 专知VIP

会员服务 ·

26

CMU · 博士论文 · 机器人 ·

2023 年 11 月 4 日

【CMU博士论文】强化学习的泛化灵巧性，182页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

灵巧性，即与物理世界进行复杂交互的能力，是机器人技术的核心。然而，现有的机器人操纵研究集中在灵巧性有限的任务上，如拾放。机器人的动作技能往往是准静态的，具有预定义或有限的接触事件序列，并涉及受限的物体运动。与此相反，人类使用动态和丰富的接触操作技能与周围环境互动，使我们能够在更广泛的环境中执行更多种类的任务。

本论文探讨了使用强化学习（RL）为机器人装备泛化灵巧性的方法。RL解决了建模为马尔可夫决策过程（MDP）的顺序决策问题。RL在许多领域，如游戏，都取得了显著的成功，使其成为开发高级操作技能的有希望的技术。我们的研究为以下论题声明提供支持：重新考虑我们如何将机器人问题框定为MDP是通过RL实现泛化灵巧性的有效且必要的方法。我们审查了将RL应用于操控时面临的三个挑战，并讨论了我们通过重新考虑MDP公式来克服它们的方法。

首先，机器人数据的收集既耗时又昂贵。为了有效地重用机器人数据，我们提出了一种离线RL算法，通过构建MDP的潜在操作空间。此外，我们讨论了一个框架，可以在具有非平稳动态的环境中有效地重用机器人数据。其次，机器人的灵巧性通常被认为受到机器人硬件设计的限制。我们提议通过利用外部环境来增强机器人的灵巧性，超越其硬件限制，展现出动态和丰富的接触行为。我们证明，重新思考我们如何定义MDP的环境在提高机器人使用RL的灵巧性方面是有效的。第三，学习可以推广的灵巧技能是具有挑战性的。我们提出了一个RL框架，该框架具有空间定位和时间抽象的操作表示，使机器人能够学习可以推广到未见物体的复杂交互。这进一步支持了我们的说法，即重新思考MDP的操作空间可以导致泛化的灵巧性。

成为VIP会员查看完整内容

41

相关内容

CMU

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

专知会员服务

33+阅读 · 2023年12月24日

【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf

【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf

专知会员服务

28+阅读 · 2023年10月4日

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【CMU博士论文】可解释机器学习方法与应用，127页pdf

【CMU博士论文】可解释机器学习方法与应用，127页pdf

专知会员服务

77+阅读 · 2023年6月6日

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

专知会员服务

46+阅读 · 2023年4月26日

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

专知会员服务

30+阅读 · 2023年3月6日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

74+阅读 · 2023年1月14日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知会员服务

56+阅读 · 2022年11月21日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

88+阅读 · 2022年7月11日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

相关VIP内容

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

专知会员服务

33+阅读 · 2023年12月24日

【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf

【CMU博士论文】持续机器人学习:基准和模块化方法，125页pdf

专知会员服务

28+阅读 · 2023年10月4日

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【CMU博士论文】可解释机器学习方法与应用，127页pdf

【CMU博士论文】可解释机器学习方法与应用，127页pdf

专知会员服务

77+阅读 · 2023年6月6日

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

专知会员服务

46+阅读 · 2023年4月26日

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

专知会员服务

30+阅读 · 2023年3月6日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

74+阅读 · 2023年1月14日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知会员服务

56+阅读 · 2022年11月21日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

88+阅读 · 2022年7月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性压缩感知问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

49+阅读 · 2014年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员