11月新书-《强化学习:算法与理论》分享

2019 年 11 月 28 日 深度学习与NLP

    分享一本由Alekh Agarwal、Nan Jiang和Sham M. Kakade编写的新书,《强化学习:算法与理论》。本书11月最新release出来的讲解强化学习的书籍,目前还在持续更新中,最新版本刚刚放出来,分享给大家。

    文末附本书pdf最新版下载地址。

    与以往动辄几百页的强化学习书籍相比,本书比较精悍,目前只有80多页,内容比较简洁干练,适合想要快速了解强化学习基础的朋友。

     

目录

  正文内容截图

本书最新版下载地址

    微信公众号“深度学习与NLP”回复关键字“drsl19”获取下载地址。

往期精品内容推荐

Barbara Plank-NLP模型的跨语言/跨领域迁移-经验分享

最新VR版“Half-Life Alyx”-超真实体验

Pytorch官方力荐-11月新书《Pytorch深度学习实战指南》pdf及代码分享

自然语言处理常见数据集、论文最全整理分享

斯坦福NLP组-2019-《CS224n: NLP与深度学习》-分享

免费自然语言处理(NLP)课程及教材分享

UC Berkeley《人工智能基础-2018》课程及视频教程(带中英文字幕)分享

BERT-基于双向Transformer预训练模型原理详解

实战经验分享-少量数据NLP场景下进行深度学习训练的建议

免费教材-《数据科学基础-2018》最新版下载

吴恩达 - 如何规划机器学习职业生涯

深度学习与计算机视觉任务应用综述

扫描下方二维码可以订阅哦!

DeepLearning_NLP

深度学习与NLP

       商务合作请联系微信号:lqfarmerlq

登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
151+阅读 · 2020年6月27日
【斯坦福】凸优化圣经- Convex Optimization (附730pdf下载)
专知会员服务
221+阅读 · 2020年6月5日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
吴恩达新书《Machine Learning Yearning》完整中文版
专知会员服务
145+阅读 · 2019年10月27日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
机器学习在材料科学中的应用综述,21页pdf
专知会员服务
48+阅读 · 2019年9月24日
简明深度学习学习资料分享:从基础到进阶
深度学习与NLP
27+阅读 · 2019年9月7日
斯坦福CS236-深度生成模型2019-全套课程资料分享
深度学习与NLP
20+阅读 · 2019年8月20日
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
2019最新-UC Berkeley-《深度学习入门课程》分享
深度学习与NLP
13+阅读 · 2019年3月1日
Jacob Eisenstein《自然语言处理》最新经典教材免费分享
深度学习与NLP
24+阅读 · 2019年2月13日
MIT深度学习基础-2019视频课程分享
深度学习与NLP
10+阅读 · 2019年2月7日
中文版新书《动手学深度学习》pdf免费分享
深度学习与NLP
75+阅读 · 2018年12月2日
CMU-2018年8月-深度学习基础课程视频分享
深度学习与NLP
6+阅读 · 2018年9月20日
<好书推荐> -《Pro Deep Learning with TensorFlow》分享
深度学习与NLP
12+阅读 · 2018年9月13日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
Weight Poisoning Attacks on Pre-trained Models
Arxiv
5+阅读 · 2020年4月14日
Financial Time Series Representation Learning
Arxiv
10+阅读 · 2020年3月27日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
13+阅读 · 2018年1月20日
Arxiv
4+阅读 · 2017年7月25日
VIP会员
相关资讯
简明深度学习学习资料分享:从基础到进阶
深度学习与NLP
27+阅读 · 2019年9月7日
斯坦福CS236-深度生成模型2019-全套课程资料分享
深度学习与NLP
20+阅读 · 2019年8月20日
李宏毅-《机器学习/深度学习-2019》视频及资料分享
深度学习与NLP
42+阅读 · 2019年3月20日
2019最新-UC Berkeley-《深度学习入门课程》分享
深度学习与NLP
13+阅读 · 2019年3月1日
Jacob Eisenstein《自然语言处理》最新经典教材免费分享
深度学习与NLP
24+阅读 · 2019年2月13日
MIT深度学习基础-2019视频课程分享
深度学习与NLP
10+阅读 · 2019年2月7日
中文版新书《动手学深度学习》pdf免费分享
深度学习与NLP
75+阅读 · 2018年12月2日
CMU-2018年8月-深度学习基础课程视频分享
深度学习与NLP
6+阅读 · 2018年9月20日
<好书推荐> -《Pro Deep Learning with TensorFlow》分享
深度学习与NLP
12+阅读 · 2018年9月13日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
Top
微信扫码咨询专知VIP会员