548页MIT强化学习教程，收藏备用【PDF下载】

2018 年 10 月 11 日 机器学习算法与Python学习

本书分为三个部分。

第一部分根据马尔可夫决策过程定义强化学习问题。
第二部分提供了基本的解决方案：动态规划，蒙特卡罗方法和时差学习。
第三部分提出了解决方法的统一视图，并结合了人工神经网络，资格跟踪和规划。

最后两章介绍了案例研究，并考虑了强化学习的未来。

第二版的网站：

http://incompleteideas.net/book/the-book-2nd.html

python实现的代码:

https://github.com/ShangtongZhang/reinforcement-learning-an-introduction

课程资料：

http://incompleteideas.net/609%20dropbox/

完整教程下载

关注公众号，后台回复

20181011

今日推荐

《强化学习》

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

强化学习和最优控制的《十个关键点》81页PPT汇总

专知会员服务

107+阅读 · 2020年3月2日

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

148+阅读 · 2019年12月25日

【强化学习资源集合】Awesome Reinforcement Learning

专知会员服务

98+阅读 · 2019年12月23日

Uber AI NeurIPS 2019《元学习meta-learning》教程，附92页PPT下载

专知会员服务

113+阅读 · 2019年12月13日

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

专知会员服务

282+阅读 · 2019年10月9日

【CMU】机器学习导论课程（Introduction to Machine Learning）

专知会员服务

61+阅读 · 2019年8月26日

圣经书||《强化学习导论(2nd)》原书、代码、习题答案、课程视频大全

专知

59+阅读 · 2020年3月5日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

强化学习从入门到放弃：汪军李宏毅等大佬资源大放送！

新智元

23+阅读 · 2018年12月29日

简单粗暴TensorFlow学习教程（PDF）

专知

8+阅读 · 2018年11月18日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

【下载】机器学习TensorFlow代码教程实战书籍和代码

专知

96+阅读 · 2017年12月2日

【推荐】增强学习导论(最新完整版草稿2017.11.5)

机器学习研究会

6+阅读 · 2017年11月23日

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

专知

5+阅读 · 2017年10月23日

【AlphaGo核心技术-教程学习笔记03】深度强化学习第三讲动态规划寻找最优策略

专知

10+阅读 · 2017年10月22日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Precise Detection in Densely Packed Scenes

Arxiv

3+阅读 · 2019年4月8日

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Image Captioning based on Deep Reinforcement Learning

Arxiv

9+阅读 · 2018年9月13日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Viewpoint Estimation-Insights & Model

Arxiv

3+阅读 · 2018年7月3日

Neural Network Based Reinforcement Learning for Audio-Visual Gaze Control in Human-Robot Interaction

Arxiv

6+阅读 · 2018年4月23日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

548页MIT强化学习教程，收藏备用【PDF下载】

相关内容

知识荟萃

更多