【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt - 专知

会员服务 ·

0

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

2019 年 12 月 16 日 专知

导读

强化学习是一种系统的学习和决策方法。经过近几十年来发展和研究，现在RL与深度学习相结合，展示了当今RL系统的能力，并激发了人们极大的兴趣。本教程回顾了强化学习的过去，总结了一些挑战，最后展望了强化学习未来的研究可能和现实应用。

作者 | Katja Hofmann

编译 | Xiaowen

aka.ms/gameintelligence
Twitter: @katjahofmann

地址： https://neurips.cc/Conferences/2019/Schedule?showEvent=13211

目录

⊙形式化RL Formalizing RL

⊙值函数 Value Functions

⊙探索 Exploration

⊙策略梯度与Actor-Critic算法

⊙生成 Generalization

⊙结构 Structure

⊙模型 Models

⊙新的挑战

01

Formalizing RL

形式化RL

强化学习的主要挑战：

探索-利用困境 Explore-exploit
信用分配问题 Credit assignment
函数近似 Function approximation

贴几个资料供学习：

1. https://blog.csdn.net/xbinworld/article/details/79372777

2. https://antkillerfarm.github.io/rl/2018/11/18/RL

02

Value Functions

值函数

篇幅有限，完整内容请下载全文PPT查看，下载方式见文末。

3

Function Approximation

函数近似

04

Exploration

探索

05

Policy Gradient and Actor Critic Approaches

策略梯度与Actor-Critic算法

篇幅有限，完整内容请下载全文PPT查看，下载方式见文末。

完整PPT下载：关注专知公众号（点击上方蓝色专知关注）

后台回复“NIPS2019RL” 获取强化学习：过去、现在和未来展望97页ppt链接下载索引~

更多“强化学习”相关内容，请登录专知网站www.zhuanzhi.ai，搜索“强化学习”获取更多相关资料：

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

点击“阅读原文”，了解使用专知，查看5000+AI主题知识资料

登录查看更多

12

相关内容

Katja Hofmann

Katja Hofmann，微软剑桥研究院游戏情报组的首席研究员。她领导了一个研究小组，致力于在电子游戏中应用强化学习。她的长期目标是开发人工智能系统，学习与人协作，增强用户能力，帮助解决复杂的现实问题。在加入微软研究院之前，她在阿姆斯特丹大学的ILPS小组完成了计算机科学博士学位。她曾与Maarten de Rijke和Shimon Whiteson合作开发智能搜索引擎。个人主页：[https://www.microsoft.com/en-us/research/people/kahofman/](https://www.microsoft.com/en-us/research/people/kahofman/)

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

专知会员服务

48+阅读 · 2020年7月5日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

Python数据分析:过去、现在和未来，52页ppt

Python数据分析:过去、现在和未来，52页ppt

专知会员服务

102+阅读 · 2020年3月9日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知会员服务

235+阅读 · 2020年1月21日

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

专知会员服务

59+阅读 · 2019年12月9日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

专知会员服务

34+阅读 · 2019年3月21日

【Google】微型化机器学习教程，17页ppt，Getting Started with TinyML

【Google】微型化机器学习教程，17页ppt，Getting Started with TinyML

专知

10+阅读 · 2020年3月28日

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

专知

17+阅读 · 2019年12月13日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

130+阅读 · 2019年10月28日

Facebook首席AI科学家 Yann Lecun《深度学习硬件-过去，现在，未来》-附80页PPT

Facebook首席AI科学家 Yann Lecun《深度学习硬件-过去，现在，未来》-附80页PPT

中国人工智能学会

12+阅读 · 2019年2月25日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

【腾讯AI Lab主任张潼】深度学习与强化学习（附slide下载）

【腾讯AI Lab主任张潼】深度学习与强化学习（附slide下载）

专知

8+阅读 · 2017年12月4日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

On Improving Decentralized Hysteretic Deep Reinforcement Learning

On Improving Decentralized Hysteretic Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年12月15日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Deep Reinforcement Learning for Page-wise Recommendations

Arxiv

8+阅读 · 2018年5月7日

A dataset and architecture for visual reasoning with a working memory

Arxiv

3+阅读 · 2018年3月16日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

VIP会员

相关主题

相关VIP内容

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

【MLSS2020】流数据贝叶斯预测，米兰Sonia Petrone教授，80页ppt

专知会员服务

48+阅读 · 2020年7月5日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

Python数据分析:过去、现在和未来，52页ppt

Python数据分析:过去、现在和未来，52页ppt

专知会员服务

102+阅读 · 2020年3月9日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知会员服务

235+阅读 · 2020年1月21日

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

专知会员服务

59+阅读 · 2019年12月9日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

专知会员服务

34+阅读 · 2019年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【Google】微型化机器学习教程，17页ppt，Getting Started with TinyML

【Google】微型化机器学习教程，17页ppt，Getting Started with TinyML

专知

10+阅读 · 2020年3月28日

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

专知

17+阅读 · 2019年12月13日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知

26+阅读 · 2019年11月20日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

130+阅读 · 2019年10月28日

Facebook首席AI科学家 Yann Lecun《深度学习硬件-过去，现在，未来》-附80页PPT

Facebook首席AI科学家 Yann Lecun《深度学习硬件-过去，现在，未来》-附80页PPT

中国人工智能学会

12+阅读 · 2019年2月25日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【伯克利大学ICML2018强化学习80页教程】【附下载】

【伯克利大学ICML2018强化学习80页教程】【附下载】

专知

10+阅读 · 2018年7月21日

【腾讯AI Lab主任张潼】深度学习与强化学习（附slide下载）

【腾讯AI Lab主任张潼】深度学习与强化学习（附slide下载）

专知

8+阅读 · 2017年12月4日

相关论文

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

On Improving Decentralized Hysteretic Deep Reinforcement Learning

On Improving Decentralized Hysteretic Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年12月15日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Deep Reinforcement Learning for Page-wise Recommendations

Arxiv

8+阅读 · 2018年5月7日

A dataset and architecture for visual reasoning with a working memory

Arxiv

3+阅读 · 2018年3月16日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

大家都在搜

CMU博士论文

无人机集群

软件无线电

久别重逢话双塔

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员