【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

2019 年 11 月 14 日 专知

【导读】Imitation Learning（模仿学习）是强化学习的一个分支，因其能很好的解决强化学习中的多步决策（sequential decision）问题，近段时间得到了广泛关注。那么模仿学习近期的前沿进展如何呢，来自加州理工大学的Yisong Yue，昨天在芝加哥大学，做了名为《New Frontiers in Imitation Learning》讲座。新鲜出炉的PPT，一起来看看吧。

简介：

随着时空跟踪和传感数据的不断增长，现在人们可以在大范围内分析和建模细粒度行为。例如，收集每一场NBA篮球比赛的跟踪数据，包括球员、裁判和以25hz频率跟踪的球，以及带注释的比赛事件，如传球、投篮和犯规。其他设置包括实验室动物、公共空间中的人、手术室等设置中的专业人员、演员的演讲和表演、虚拟环境中的数字化身、自然现象(如空气动力学)，甚至其他计算系统的行为。

在这次演讲中，我将描述正在进行的研究，即开发结构化模仿学习方法来开发细粒度行为的预测模型。模仿学习是机器学习的一个分支，研究模仿动态演示行为。结构化模仿学习涉及到使用数学上严格的领域知识，这些知识可以(有时是可以证明的)加速学习，还可以提供附加的好处(如Lyapunov稳定性或策略行为的可解释性)。我将提供基本问题设置的高级概述，以及在动物建模、专业运动、语音动画等项目。

Speaker：

Yisong Yue，加州理工学院计算机和数学科学系助理教授。他之前是迪斯尼研究中心的研究科学家。在此之前，他是卡内基梅隆大学机器学习系和iLab的博士后研究员。他获得了康奈尔大学的博士学位和伊利诺伊大学香槟分校的学士学位。

Yisong的研究兴趣主要集中在统计机器学习的理论和应用上。他对开发交互式机器学习和结构化机器学习的新方法特别感兴趣。过去,他的研究已经应用于信息检索、推荐系统、文本分类、学习丰富的用户界面,分析人类隐式反馈、临床治疗、辅导系统,数据驱动动画、行为分析、运动分析、实验设计科学,学习优化策略学习机器人技术和自适应规划和分配问题。

个人主页：

http://www.yisongyue.com/

部分PPT：

完整PPT下载：

请关注专知公众号（点击上方蓝色专知关注）

后台回复“MFXX” 就可以获取本文完整PPT下载链接~

更多关于“模仿学习”的论文知识资料，请登录专知网站www.zhuanzhi.ai,查看：

https://www.zhuanzhi.ai/topic/2001152754864545/new

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，或者点击“阅读原文”使用，获取更多AI知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加）， 获取专知VIP会员码 ，加入专知人工智能主题群，咨询技术商务合作~

点击“阅读原文”，注册使用专知

登录查看更多

相关内容

模仿学习

关注 322

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日