【南洋理工Xavier】深度强化学习,课件与代码,109页PPT

【导读】Xavier Bresson是新加坡南洋理工的副教授,他开设的深度学习数据科学课程《Deep Learning For Data Science》,内容充实,前沿新颖。在第15节课程深度强化学习,Xavier博士一步步讲解了最受欢迎的强化学习算法DQN, REINFORCE, QAC, AAC: ,课件含有109页ppt,并且涵盖代码,值得学习。



Xavier Bresson,是新加坡南洋理工大学计算机科学副教授。他目前的研究重点是弥合稀疏数据表示和谱图理论之间的差距,为大数据科学设计新的算法。

https://www.ntu.edu.sg/home/xbresson/bio.html


深度强化学习


目录:

  • RL与深度学习

  • 代理,环境与MDP

  • 策略,值函数与模型

  • 最优值函数与策略

  • DQN

  • 策略网络

  • Actor-Critic 算法

  • RL与监督学习

  • 学习与规划

深度强化学习:深度学习+强化学习


强化学习框架



策略函数、值函数、模型函数



最优值函数与策略

DQN算法


策略网络算法

演员-评论员算法

强化学习与监督学习相似性

学习与规划

完整版查看:关注专知公众号(点击上方蓝色专知关注

  • 后台回复“NRL” 获取109页《Deep Reinforcement Learning》PPT下载链接索引~




代码

https://github.com/xbresson/CE7454_2019/tree/master/codes/labs_lecture15



更多关于“强化学习”的论文知识资料,请登录专知网站www.zhuanzhi.ai查看,或者点击“阅读原文查看:

https://www.zhuanzhi.ai/topic/2001320766352755/awesome 





-END-
专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
请加专知小助手微信(扫一扫如下二维码添加),获取专知VIP会员码,加入专知人工智能主题群,咨询技术商务合作~
点击“阅读原文”,了解成为 专知会员 ,查看5000+AI主题知识资料
展开全文
Top
微信扫码咨询专知VIP会员