成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
模仿学习
关注
320
模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,比如执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。当智能体学习人类行为时,虽然我们也需要使用模仿学习,但实时的行为模拟成本会非常高。与之相反,吴恩达提出的学徒学习(Apprenticeship learning)执行的是存粹的贪婪/利用(exploitative)策略,并使用强化学习方法遍历所有的(状态和行为)轨迹(trajectories)来学习近优化策略。它需要极难的计略(maneuvers),而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态,所以可为自动驾驶这样的许多任务提供更可靠的通用框架。
综合
百科
VIP
热门
动态
论文
精华
【NeurIPS 2020】生成对抗性模仿学习的f-Divergence
专知
0+阅读 · 2020年10月9日
伯克利大学《深度强化学习》更新 | 第二讲:监督学习和模仿学习
AI科技评论
5+阅读 · 2019年1月10日
NIPS2018 | 腾讯AI Lab入选20篇论文,含2篇Spotlight
AI100
0+阅读 · 2018年10月15日
要抢足球教练饭碗!切尔西未来或将用上AI教练
量子位
0+阅读 · 2018年11月17日
伯克利与OpenAI联合发文,通过最新「模仿学习」技术为机器人「赋能」(附论文)
机器人圈
2+阅读 · 2017年7月15日
机器人顶级会议精华提炼(20190617-20190622)
泡泡机器人SLAM
2+阅读 · 2019年6月22日
PRD、产品体验报告写不好?10天带你掌握高阶产品经理的文档写作法
人人都是产品经理
0+阅读 · 2018年4月23日
使用模仿学习攻克Atari最难游戏!DeepMind新论文解读
CreateAMind
6+阅读 · 2018年6月9日
【ICML2022】通过评估演示者的专业知识进行模仿学习
专知
3+阅读 · 2022年7月18日
年薪百万-骥智CreateAMind2019招聘目标:年薪百万招聘大牛50+ 推荐成功送mate20
CreateAMind
0+阅读 · 2019年2月16日
和 DeepMind 一起考虑如何在 AI 中重现人类的价值观
雷锋网
1+阅读 · 2018年11月26日
学界 | 从监督式到DAgger,综述论文描绘模仿学习全貌
机器之心
1+阅读 · 2018年1月29日
【2022新书】机器学习的实用模拟与合成,428页pdf
专知
18+阅读 · 2022年8月10日
学界 | 斯坦福大学&DeepMind联合提出机器人控制新方法,RL+IL端到端地学习视觉运动策略
机器之心
0+阅读 · 2018年3月19日
运营思路篇之类比性原理VS第一性原理
互联网er的早读课
0+阅读 · 2017年9月3日
参考链接
父主题
机器学习
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top