南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程 - 专知VIP

会员服务 ·

14

模仿学习 · 论文 ·

2022 年 2 月 3 日

南京大学&港中文联合总结: 29页中文详述《模仿学习》完整过程

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

简介模仿学习，是一种从专家示例中进行学习的方法。这里专家示例指的是由最优（或者次优）策略采集到的状态-动作序列，智能体便是通过模仿专家示例来学习策略。模仿学习主要包含两大类算法框架：行为克隆和对抗式模仿学习。基于这两种算法框架，研究者们提出了各种各样的模仿学习算法，在实验中取得了很好的效果。尽管已经有很多对模仿学习算法的实验研究，关于模仿学习算法的理论分析直到最近才被逐步建立和完善。这些理论结果很好地解释了算法的实验现象，并且对今后的算法设计也有启发。模仿学习简要教程着重从统计学习理论的角度来介绍模仿学习算法，能使读者对模仿学习算法有深刻的理解，使读者能够通过借助理论来分析已有的实验结果、并且设计更好的算法。

完整版PDF下载方式: (1)登录论坛下载(未注册显示无权限下载)

http://deeprl.neurondance.com/d/382-29

(2) https://www.lamda.nju.edu.cn/xut/Imitation_Learning.pdf

成为VIP会员查看完整内容

63

相关内容

模仿学习

模仿学习是学习尝试模仿专家行为从而获取最佳性能的一系列任务。目前主流方法包括监督式模仿学习、随机混合迭代学习和数据聚合模拟学习等方法。模仿学习（Imitation Learning）背后的原理是是通过隐含地给学习器关于这个世界的先验信息，比如执行、学习人类行为。在模仿学习任务中，智能体（agent）为了学习到策略从而尽可能像人类专家那样执行一种行为，它会寻找一种最佳的方式来使用由该专家示范的训练集（输入-输出对）。当智能体学习人类行为时，虽然我们也需要使用模仿学习，但实时的行为模拟成本会非常高。与之相反，吴恩达提出的学徒学习（Apprenticeship learning）执行的是存粹的贪婪/利用（exploitative）策略，并使用强化学习方法遍历所有的（状态和行为）轨迹（trajectories）来学习近优化策略。它需要极难的计略（maneuvers），而且几乎不可能从未观察到的状态还原。模仿学习能够处理这些未探索到的状态，所以可为自动驾驶这样的许多任务提供更可靠的通用框架。

港中文《深度学习单图像超分辨率》综述论文

专知会员服务

41+阅读 · 2021年9月30日

机器推理的进展与展望

专知会员服务

44+阅读 · 2021年3月8日

元强化学习综述及前沿进展

元强化学习综述及前沿进展

专知会员服务

62+阅读 · 2021年1月31日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

114+阅读 · 2020年12月31日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

专知会员服务

66+阅读 · 2020年8月22日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

深度强化学习实验室

0+阅读 · 2022年1月12日

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

专知

1+阅读 · 2021年11月11日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【DeepMind教程】蒙特卡罗树搜索，60页ppt

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知

2+阅读 · 2021年4月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

万字长文| 中文知识图谱构建技术以及应用的综述

万字长文| 中文知识图谱构建技术以及应用的综述

中国人工智能学会

71+阅读 · 2019年9月9日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

深度学习的中文资源，教程推荐！

深度学习的中文资源，教程推荐！

机器学习研究会

19+阅读 · 2017年11月28日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

广义反应扩散神经网络的复杂动力学与同步控制

国家自然科学基金

0+阅读 · 2013年12月31日

中文发展性阅读障碍儿童知觉学习能力缺陷的认知神经机制

国家自然科学基金

0+阅读 · 2012年12月31日

汉语词法与句法结构的统一分析

国家自然科学基金

0+阅读 · 2012年12月31日

Lé过程和分数阶Lé过程驱动的动力系统的动力学性质研究

国家自然科学基金

0+阅读 · 2012年12月31日

手写中文文本识别的高扩展判别学习理论和方法

国家自然科学基金

0+阅读 · 2012年12月31日

阈性状基因组育种值(gEBV)估计的贝叶斯方法

国家自然科学基金

0+阅读 · 2011年12月31日

篇章级中文语义分析理论与方法

国家自然科学基金

0+阅读 · 2011年12月31日

资助《数学进展》期刊

国家自然科学基金

3+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

A Brief Guide to Designing and Evaluating Human-Centered Interactive Machine Learning

Arxiv

0+阅读 · 2022年4月20日

Towards Fine-grained Causal Reasoning and QA

Towards Fine-grained Causal Reasoning and QA

Arxiv

0+阅读 · 2022年4月15日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Self-supervised Learning: Generative or Contrastive

Arxiv

19+阅读 · 2020年7月21日

Imbalance Problems in Object Detection: A Review

Arxiv

25+阅读 · 2020年3月11日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

VIP会员

相关主题

相关VIP内容

港中文《深度学习单图像超分辨率》综述论文

专知会员服务

41+阅读 · 2021年9月30日

机器推理的进展与展望

专知会员服务

44+阅读 · 2021年3月8日

元强化学习综述及前沿进展

元强化学习综述及前沿进展

专知会员服务

62+阅读 · 2021年1月31日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

114+阅读 · 2020年12月31日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

专知会员服务

66+阅读 · 2020年8月22日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

深度强化学习实验室

0+阅读 · 2022年1月12日

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

《中文机器阅读理解》教程，哈工大讯飞联合实验室主管研究员崔一鸣

专知

1+阅读 · 2021年11月11日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【DeepMind教程】蒙特卡罗树搜索，60页ppt

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知

2+阅读 · 2021年4月7日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

万字长文| 中文知识图谱构建技术以及应用的综述

万字长文| 中文知识图谱构建技术以及应用的综述

中国人工智能学会

71+阅读 · 2019年9月9日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

深度学习的中文资源，教程推荐！

深度学习的中文资源，教程推荐！

机器学习研究会

19+阅读 · 2017年11月28日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

相关基金

广义反应扩散神经网络的复杂动力学与同步控制

国家自然科学基金

0+阅读 · 2013年12月31日

中文发展性阅读障碍儿童知觉学习能力缺陷的认知神经机制

国家自然科学基金

0+阅读 · 2012年12月31日

汉语词法与句法结构的统一分析

国家自然科学基金

0+阅读 · 2012年12月31日

Lé过程和分数阶Lé过程驱动的动力系统的动力学性质研究

国家自然科学基金

0+阅读 · 2012年12月31日

手写中文文本识别的高扩展判别学习理论和方法

国家自然科学基金

0+阅读 · 2012年12月31日

阈性状基因组育种值(gEBV)估计的贝叶斯方法

国家自然科学基金

0+阅读 · 2011年12月31日

篇章级中文语义分析理论与方法

国家自然科学基金

0+阅读 · 2011年12月31日

资助《数学进展》期刊

国家自然科学基金

3+阅读 · 2009年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

A Brief Guide to Designing and Evaluating Human-Centered Interactive Machine Learning

Arxiv

0+阅读 · 2022年4月20日

Towards Fine-grained Causal Reasoning and QA

Towards Fine-grained Causal Reasoning and QA

Arxiv

0+阅读 · 2022年4月15日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

Self-supervised Learning: Generative or Contrastive

Arxiv

19+阅读 · 2020年7月21日

Imbalance Problems in Object Detection: A Review

Arxiv

25+阅读 · 2020年3月11日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

微信扫码咨询专知VIP会员