For a successful deployment of physical Human-Robot Cooperation (pHRC), humans need to be able to teach robots new motor skills quickly. Probabilistic movement primitives (ProMPs) are a promising method to encode a robot's motor skills learned from human demonstrations in pHRC settings. However, most algorithms to learn ProMPs from human demonstrations operate in batch mode, which is not ideal in pHRC. In this paper we propose a new learning algorithm to learn ProMPs incrementally in pHRC settings. Our algorithm incorporates new demonstrations sequentially as they arrive, allowing humans to observe the robot's learning progress and incrementally shape the robot's motor skill. A built in forgetting factor allows for corrective demonstrations resulting from the human's learning curve or changes in task constraints. We compare the performance of our algorithm to existing batch ProMP algorithms on reference data generated from a pick-and-place task at our lab. Furthermore, we show in a proof of concept study on a Franka Emika Panda how the forgetting factor allows us to adopt changes in the task. The incremental learning algorithm presented in this paper has the potential to lead to a more intuitive learning progress and to establish a successful cooperation between human and robot faster than training in batch mode.


翻译:为了成功部署人体-机器人合作(pHRC),人类需要能够迅速教授机器人新的运动技能。概率运动原始(ProMPs)是将机器人在PHRC环境中的人类演示中学到的运动技能编码起来的一个很有希望的方法。然而,从人类演示中学习ProMP的多数算法都以批量模式运作,这在pHRC中并不理想。在本文中,我们提出一种新的学习算法,以在 pHRC 设置中逐步学习ProMP。我们的算法包含在机器人到达时按顺序排列的新演示,允许人类观察机器人的学习进展并逐步塑造机器人的运动技能。在遗忘因素中构建的可因人类学习曲线或任务限制的变化而导致的纠正演示。我们比较我们从人类演示中学习ProMP算法的功能与从我们实验室的选位任务中获得的参考数据的现有批量 ProMP算法的性能。此外,我们在概念研究中展示了弗朗卡·埃米卡·潘达(Franka Emika Panda) 的遗忘因素如何允许我们在任务中采用变化。在本文中提供的递增学算法式算法中有可能在机器人和更成功的学习方式上建立一种机器人之间的学习模式。

0
下载
关闭预览

相关内容

元强化学习综述及前沿进展
专知会员服务
60+阅读 · 2021年1月31日
深度学习界圣经“花书”《Deep Learning》中文版来了
专知会员服务
230+阅读 · 2019年10月26日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | ISMAR 2019等国际会议信息8条
Call4Papers
3+阅读 · 2019年3月5日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Relay-Assisted Cooperative Federated Learning
Arxiv
0+阅读 · 2021年7月20日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
VIP会员
相关资讯
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
计算机 | ISMAR 2019等国际会议信息8条
Call4Papers
3+阅读 · 2019年3月5日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员