机器人运动轨迹的模仿学习综述

2021 年 11 月 12 日 专知


摘要: 作为机器人技能学习中的一个重要分支, 模仿学习近年来在机器人系统中得到了广泛的应用. 模仿学习能够将人类的技能以一种相对直接的方式迁移到机器人系统中, 其思路是先从少量示教样本中提取相应的运动特征, 然后将该特征泛化到新的情形. 本文针对机器人运动轨迹的模仿学习进行综述. 首先 详细解释模仿学习中的技能泛化、收敛性和外插等基本问题; 其次从原理上对动态运动基元、概率运动基元和核化运动基元等主要的模仿学习算法进行介绍; 然后深入地讨论模仿学习中姿态和刚度矩阵的学习问题、协同和不确定性预测的问题以及人机交互中的模仿学习等若干关键问题; 最后本文探讨了结合因果推理的模仿学习等几个未来的发展方向.


http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210033



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RMIM” 就可以获取机器人运动轨迹的模仿学习综述》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
1

相关内容

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,比如执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。当智能体学习人类行为时,虽然我们也需要使用模仿学习,但实时的行为模拟成本会非常高。与之相反,吴恩达提出的学徒学习(Apprenticeship learning)执行的是存粹的贪婪/利用(exploitative)策略,并使用强化学习方法遍历所有的(状态和行为)轨迹(trajectories)来学习近优化策略。它需要极难的计略(maneuvers),而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态,所以可为自动驾驶这样的许多任务提供更可靠的通用框架。
对话推荐算法研究综述
专知会员服务
49+阅读 · 2022年2月18日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
67+阅读 · 2021年9月10日
专知会员服务
35+阅读 · 2021年5月25日
专知会员服务
31+阅读 · 2021年2月17日
专知会员服务
136+阅读 · 2021年1月13日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
37+阅读 · 2020年8月19日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
对话推荐算法研究综述
专知
0+阅读 · 2022年2月18日
深度强化学习的攻防与安全性分析综述
专知
1+阅读 · 2022年1月16日
联邦学习研究综述
专知
11+阅读 · 2021年12月25日
深度学习中的单阶段小目标检测方法综述
专知
0+阅读 · 2021年11月23日
【ICML2021】基于观察的跨域模仿学习
专知
2+阅读 · 2021年8月30日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
基于深度学习的行人检测方法综述
专知
1+阅读 · 2021年4月14日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
20+阅读 · 2018年1月17日
VIP会员
相关VIP内容
对话推荐算法研究综述
专知会员服务
49+阅读 · 2022年2月18日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
67+阅读 · 2021年9月10日
专知会员服务
35+阅读 · 2021年5月25日
专知会员服务
31+阅读 · 2021年2月17日
专知会员服务
136+阅读 · 2021年1月13日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
37+阅读 · 2020年8月19日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
相关资讯
对话推荐算法研究综述
专知
0+阅读 · 2022年2月18日
深度强化学习的攻防与安全性分析综述
专知
1+阅读 · 2022年1月16日
联邦学习研究综述
专知
11+阅读 · 2021年12月25日
深度学习中的单阶段小目标检测方法综述
专知
0+阅读 · 2021年11月23日
【ICML2021】基于观察的跨域模仿学习
专知
2+阅读 · 2021年8月30日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
基于深度学习的行人检测方法综述
专知
1+阅读 · 2021年4月14日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员