【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习:过去、现在和未来展望,附97页ppt

2019 年 12 月 16 日 专知

导读

强化学习是一种系统的学习和决策方法。经过近几十年来发展和研究,现在RL与深度学习相结合,展示了当今RL系统的能力,并激发了人们极大的兴趣。本教程回顾了强化学习的过去,总结了一些挑战,最后展望了强化学习未来的研究可能和现实应用。


作者 | Katja Hofmann
编译 | Xiaowen


aka.ms/gameintelligence
Twitter: @katjahofmann
地址: https://neurips.cc/Conferences/2019/Schedule?showEvent=13211



目录
形式化RL Formalizing RL
值函数 Value Functions
探索 Exploration
策略梯度与Actor-Critic算法
生成 Generalization
结构 Structure
模型 Models
新的挑战



01

Formalizing RL 

形式化RL



强化学习的主要挑战:
  1. 探索-利用困境 Explore-exploit
  2. 信用分配问题 Credit assignment
  3. 函数近似 Function approximation


贴几个资料供学习:
1. https://blog.csdn.net/xbinworld/article/details/79372777
2. https://antkillerfarm.github.io/rl/2018/11/18/RL

02

Value Functions

值函数



篇幅有限,完整内容请下载全文PPT查看,下载方式见文末。

3   

Function Approximation

函数近似



04

Exploration

探索



05

Policy Gradient and Actor Critic Approaches

策略梯度与Actor-Critic算法



篇幅有限,完整内容请下载全文PPT查看,下载方式见文末。


完整PPT下载:关注专知公众号(点击上方蓝色专知关注)
  • 后台回复“NIPS2019RL” 获取强化学习:过去、现在和未来展望97页ppt链接下载索引~


更多“强化学习”相关内容,请登录专知网站www.zhuanzhi.ai,搜索“强化学习”获取更多相关资料:



专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看5000+AI主题知识资料
登录查看更多
12

相关内容

Katja Hofmann,微软剑桥研究院游戏情报组的首席研究员。她领导了一个研究小组,致力于在电子游戏中应用强化学习。她的长期目标是开发人工智能系统,学习与人协作,增强用户能力,帮助解决复杂的现实问题。在加入微软研究院之前,她在阿姆斯特丹大学的ILPS小组完成了计算机科学博士学位。她曾与Maarten de Rijke和Shimon Whiteson合作开发智能搜索引擎。个人主页:[https://www.microsoft.com/en-us/research/people/kahofman/](https://www.microsoft.com/en-us/research/people/kahofman/)
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
197+阅读 · 2020年5月22日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
Arxiv
34+阅读 · 2020年1月2日
Arxiv
13+阅读 · 2019年1月26日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
VIP会员
Top
微信扫码咨询专知VIP会员