VIP内容 - 专知

会员服务 ·

模仿学习

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

【牛津博士论文】使用学习到的无知感知模型进行规划，190页pdf

【牛津博士论文】使用学习到的无知感知模型进行规划，190页pdf

专知会员服务

28+阅读 · 2024年5月19日

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

专知会员服务

28+阅读 · 2023年11月14日

模仿学习综述：算法、最新进展和挑战

模仿学习综述：算法、最新进展和挑战

专知会员服务

66+阅读 · 2023年9月9日

《用于空战行为建模的模仿学习：一项探索性研究》2023最新75页技术报告

《用于空战行为建模的模仿学习：一项探索性研究》2023最新75页技术报告

专知会员服务

138+阅读 · 2023年4月26日

模仿学习综述：传统与新进展

模仿学习综述：传统与新进展

专知会员服务

55+阅读 · 2023年2月18日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

54+阅读 · 2023年2月3日

「逆向强化学习」最新研究综述

「逆向强化学习」最新研究综述

专知会员服务

50+阅读 · 2022年12月19日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

17+阅读 · 2022年7月18日

【ICML2022】稀疏奖励目标条件强化学习的阶段性自模仿约减

【ICML2022】稀疏奖励目标条件强化学习的阶段性自模仿约减

专知会员服务

19+阅读 · 2022年6月28日

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

中文版《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知会员服务

108+阅读 · 2022年6月1日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

32+阅读 · 2022年5月6日

南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程

南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程

专知会员服务

63+阅读 · 2022年2月3日

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

专知会员服务

19+阅读 · 2021年11月22日

【ICML2021】学习权衡不完美的示范

专知会员服务

15+阅读 · 2021年9月23日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

参考链接

父主题

微信扫码咨询专知VIP会员