成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
模仿学习
关注
320
模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,比如执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。当智能体学习人类行为时,虽然我们也需要使用模仿学习,但实时的行为模拟成本会非常高。与之相反,吴恩达提出的学徒学习(Apprenticeship learning)执行的是存粹的贪婪/利用(exploitative)策略,并使用强化学习方法遍历所有的(状态和行为)轨迹(trajectories)来学习近优化策略。它需要极难的计略(maneuvers),而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态,所以可为自动驾驶这样的许多任务提供更可靠的通用框架。
综合
百科
VIP
热门
动态
论文
精华
精品内容
【牛津博士论文】使用学习到的无知感知模型进行规划,190页pdf
专知会员服务
27+阅读 · 5月19日
【牛津大学博士论文】组合优化和接触追踪的模仿学习,229页pdf
专知会员服务
27+阅读 · 2023年11月14日
模仿学习综述:算法、最新进展和挑战
专知会员服务
64+阅读 · 2023年9月9日
《用于空战行为建模的模仿学习:一项探索性研究》2023最新75页技术报告
专知会员服务
123+阅读 · 2023年4月26日
模仿学习综述:传统与新进展
专知会员服务
52+阅读 · 2023年2月18日
【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习,202页pdf
专知会员服务
53+阅读 · 2023年2月3日
「逆向强化学习」最新研究综述
专知会员服务
47+阅读 · 2022年12月19日
【ICML2022】通过评估演示者的专业知识进行模仿学习
专知会员服务
16+阅读 · 2022年7月18日
【ICML2022】稀疏奖励目标条件强化学习的阶段性自模仿约减
专知会员服务
18+阅读 · 2022年6月28日
中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织(NTO)
专知会员服务
94+阅读 · 2022年6月1日
强化学习与模仿学习的自动驾驶,CMU-Xinshuo Weng博士生,57页ppt
专知会员服务
31+阅读 · 2022年5月6日
南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程
专知会员服务
62+阅读 · 2022年2月3日
【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法
专知会员服务
18+阅读 · 2021年11月22日
【ICML2021】学习权衡不完美的示范
专知会员服务
14+阅读 · 2021年9月23日
【ICML2021】基于观察的跨域模仿学习
专知会员服务
19+阅读 · 2021年8月30日
参考链接
父主题
机器学习
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top