深度强化学习实验室
模仿学习,是一种从专家示例中进行学习的方法。这里专家示例指的是由最优(或者次优)策略采集到的状态-动作序列,智能体便是通过模仿专家示例来学习策略。模仿学习主要包含两大类算法框架:行为克隆和对抗式模仿学习。基于这两种算法框架,研究者们提出了各种各样的模仿学习算法,在实验中取得了很好的效果。尽管已经有很多对模仿学习算法的实验研究,关于模仿学习算法的理论分析直到最近才被逐步建立和完善。这些理论结果很好地解释了算法的实验现象,并且对今后的算法设计也有启发。
模仿学习简要教程着重从统计学习理论的角度来介绍模仿学习算法,能使读者对模仿学习算法有深刻的理解,使读者能够通过借助理论来分析已有的实验结果、并且设计更好的算法。
(1)登录论坛下载(未注册显示无权限下载)
http://deeprl.neurondance.com/d/382-29
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“IL29” 就可以获取《南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程》专知下载链接