【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

2019 年 11 月 28 日 专知

【导读】Xavier Bresson是新加坡南洋理工的副教授，他开设的深度学习数据科学课程《Deep Learning For Data Science》，内容充实，前沿新颖。在第15节课程深度强化学习，Xavier博士一步步讲解了最受欢迎的强化学习算法DQN, REINFORCE, QAC, AAC: ，课件含有109页ppt，并且涵盖代码，值得学习。

Xavier Bresson，是新加坡南洋理工大学计算机科学副教授。他目前的研究重点是弥合稀疏数据表示和谱图理论之间的差距，为大数据科学设计新的算法。

https://www.ntu.edu.sg/home/xbresson/bio.html

深度强化学习

目录：

RL与深度学习
代理，环境与MDP
策略，值函数与模型
最优值函数与策略
DQN
策略网络
Actor-Critic 算法
RL与监督学习
学习与规划

深度强化学习：深度学习+强化学习

强化学习框架

策略函数、值函数、模型函数

最优值函数与策略

DQN算法

策略网络算法

演员-评论员算法

强化学习与监督学习相似性

学习与规划

完整版查看：关注专知公众号（点击上方蓝色专知关注）

后台回复“NRL” 获取109页《Deep Reinforcement Learning》PPT下载链接索引~

代码

https://github.com/xbresson/CE7454_2019/tree/master/codes/labs_lecture15

更多关于“强化学习”的论文知识资料，请登录专知网站www.zhuanzhi.ai查看，或者点击“阅读原文”查看：

https://www.zhuanzhi.ai/topic/2001320766352755/awesome

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），获取专知VIP会员码，加入专知人工智能主题群，咨询技术商务合作~

点击“阅读原文”，了解成为 专知会员 ，查看5000+AI主题知识资料

登录查看更多

相关内容

深度强化学习

关注 154

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

最新《生成式对抗网络》技术综述课程，70页ppt带你学习GAN进展

专知会员服务

218+阅读 · 2020年6月20日

模型优化基础，Sayak Paul，67页ppt

专知会员服务

76+阅读 · 2020年6月8日

【ICLR2020】图神经网络与图像处理，微分方程，27页ppt

专知会员服务

48+阅读 · 2020年6月6日

【硬核课】最新《深度学习优化问题》教程，78页ppt，台大林智仁教授讲解

专知会员服务

150+阅读 · 2020年5月29日