【导读】Xavier Bresson是新加坡南洋理工的副教授,他开设的深度学习数据科学课程《Deep Learning For Data Science》,内容充实,前沿新颖。在第15节课程深度强化学习,Xavier博士一步步讲解了最受欢迎的强化学习算法DQN, REINFORCE, QAC, AAC: ,课件含有109页ppt,并且涵盖代码,值得学习。
https://www.ntu.edu.sg/home/xbresson/bio.html
深度强化学习
目录:
RL与深度学习
代理,环境与MDP
策略,值函数与模型
最优值函数与策略
DQN
策略网络
Actor-Critic 算法
RL与监督学习
学习与规划
深度强化学习:深度学习+强化学习
强化学习框架
策略函数、值函数、模型函数
最优值函数与策略
DQN算法
策略网络算法
强化学习与监督学习相似性
学习与规划
完整版查看:关注专知公众号(点击上方蓝色专知关注)
后台回复“NRL” 获取109页《Deep Reinforcement Learning》PPT下载链接索引~
代码
https://github.com/xbresson/CE7454_2019/tree/master/codes/labs_lecture15
更多关于“强化学习”的论文知识资料,请登录专知网站www.zhuanzhi.ai查看,或者点击“阅读原文”查看:
https://www.zhuanzhi.ai/topic/2001320766352755/awesome