机器人系统传统上用于制造业中自动化重复任务,如焊接、喷漆和拾放操作。尽管机器人研究取得了巨大进展,传统的装配技能仍然是一个挑战。在大多数情况下,复杂的装配技能仍然严重依赖工程师的专业知识。此外,这些技能在面对新任务或变化时容易失败,例如对象的形状或大小。随着客户对更大产品多样性的需求最近增加,这一点尤为重要。学习方法将在这种背景下变得突出,因为学习将负担从人类转移到机器人。与其试图获得周围环境的精确模型或编程控制器,机器人可以通过经验获取动力学模型或直接学习最优控制策略。

强化学习(Reinforcement Learning, RL)赋予机器人通过与周围环境互动自主找到最优行为的能力。将深度学习模型整合到RL中的方法被称为深度强化学习(Deep Reinforcement Learning, DRL),已在多个领域取得显著成就。然而,当应用于现实世界的机器人操作时,现代深度强化学习算法仍面临许多挑战。首先,机器人系统上的样本获取昂贵且繁琐。加之,无模型深度强化学习算法通常样本效率低下,即它们需要大量样本。其次,现实世界的训练引发安全问题。环境或工程师可能会施加一些约束,机器人必须始终满足这些约束以确保安全。在探索阶段,这些约束难以维持,因为这通常涉及随机动作采样。这两个挑战是阻碍深度强化学习集成到机器人控制系统中的基本问题。

本论文展示了如何可能提高样本效率和实现安全学习,使RL在现实机器人任务中更具实用性。首先,通过使用操控原语(manipulation primitives)作为动作显著提高了样本效率。操控原语既简单又足够通用,可以推广到各种任务。其次,将低层次反馈控制器纳入RL提供了先验知识,可以提高学习速度和策略性能。本研究的一个关键信息是,鲁棒且高性能的低层次控制器可以进一步提高策略的鲁棒性和性能。最后,论文探讨了缩小现实差距的方法,这是模拟到现实强化学习中的基本问题。本研究提出了一种新的接触减少方法,以提高模拟精度,促进复杂装配任务的模拟到现实的转移。

成为VIP会员查看完整内容
27

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】强化学习的泛化灵巧性,182页pdf
专知会员服务
39+阅读 · 2023年11月4日
【ETH博士论文】基于离散优化的学习,193页pdf
专知会员服务
43+阅读 · 2023年9月17日
【斯坦福博士论文】智能机器人行为自适应学习,141页pdf
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
31+阅读 · 2023年2月24日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
34+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
34+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
微信扫码咨询专知VIP会员