【新书】分布式强化学习，280页pdf - 专知

会员服务 ·

0

【新书】分布式强化学习，280页pdf

2021 年 12 月 19 日 专知

本书分为三个部分。第一部分介绍了分布式强化学习的构建模块。我们首先介绍了我们的基本研究对象，收益分布和分布Bellman方程(第二章)。第三章介绍了分类时间差分学习，一种简单的学习收益分布的算法。在第三章结束时，读者应该理解分布式强化学习的基本原则，并且应该能够在简单的实际设置中使用它。

第二部分是对分布式强化学习理论的发展。第4章介绍了一种用于测量返回分布之间距离的语言，以及与这些分布交互的操作符。第5章介绍了实现分布式强化学习所需的概率表示的概念;在此基础上，研究了用这种表示来计算和近似收益分布的问题，并引入了分布动态规划的框架。第6章研究了如何从样本中以增量的方式学习返回分布，给出了类别时间差分学习的正式结构，以及其他算法，如分位数时间差异学习。第7章将这些思想扩展到最优决策的设置(也称为控制设置)。最后，第8章介绍了基于统计泛函概念的分布强化学习的不同视角。在第二部分结束时，读者应该理解在设计分布式强化学习算法时出现的挑战，以及解决这些挑战的可用工具。

第三部分和最后一部分为实际场景ios开发了分布式强化学习。第九章回顾了线性值函数逼近的原理，并将这些思想推广到分布环境中。第10章讨论了如何将分布方法与深度神经网络相结合来获得深度强化学习的算法，并提出了一个模型来研究这种结合所产生的现象。第11章讨论了分布式强化学习在两个进一步研究领域(多主体学习和神经科学)的新兴应用，并得出结论。

https://www.distributional-rl.org/

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“D280” 就可以获取《【新书】分布式强化学习，280页pdf》专知下载链接

商务、投稿、技术等合作：请加微信助手:Quan_ABT, 或发邮件到bd@zhuanzhi.ai

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取7万+AI主题干货知识资料！

点击“ 阅读原文 ”，了解使用专知

登录查看更多

22

相关内容

分布式强化学习

分布式强化学习

重磅! 机器学习2022新书第三部来了！谷歌大牛Murphy新书《概率机器学习：高级主题》,1350页pdf！

重磅! 机器学习2022新书第三部来了！谷歌大牛Murphy新书《概率机器学习：高级主题》,1350页pdf！

专知会员服务

209+阅读 · 2022年3月1日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

73+阅读 · 2021年12月23日

【新书】统计学傻瓜式入门第二版，451页pdf

【新书】统计学傻瓜式入门第二版，451页pdf

专知会员服务

111+阅读 · 2021年11月5日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知会员服务

49+阅读 · 2021年10月21日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【2021新书】机器学习基础，400页pdf概述监督、无监督与高级技术

【2021新书】机器学习基础，400页pdf概述监督、无监督与高级技术

专知会员服务

112+阅读 · 2021年5月27日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

最新《机器学习：基本原理》2021新书，209页pdf

最新《机器学习：基本原理》2021新书，209页pdf

专知会员服务

134+阅读 · 2020年10月24日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

361+阅读 · 2020年6月24日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

231+阅读 · 2020年4月28日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知

4+阅读 · 2021年11月21日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知

45+阅读 · 2021年11月12日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知

4+阅读 · 2021年10月21日

干货书《金融数学导论: 概念与计算方法》，290页pdf

干货书《金融数学导论: 概念与计算方法》，290页pdf

专知

4+阅读 · 2021年5月7日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知

2+阅读 · 2021年3月30日

【经典书】线性代数，436页pdf

【经典书】线性代数，436页pdf

专知

3+阅读 · 2021年3月16日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

随机辛算法和多辛算法

国家自然科学基金

2+阅读 · 2014年12月31日

非期望效用理论框架下的金融随机优化问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定性条件下环境导向的城市交通出行结构优化及调控策略研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多目标蚁群算法的农村居民点布局优化研究

国家自然科学基金

0+阅读 · 2013年12月31日

图的能量与排序问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

随机非线性切换系统的智能优化控制器设计及性能分析

国家自然科学基金

0+阅读 · 2012年12月31日

复杂多自主体系统的分析、优化与调控

国家自然科学基金

0+阅读 · 2012年12月31日

基于策略迭代算法的随机Markov跳变系统优化控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

随机微分博弈及其应用研究

国家自然科学基金

5+阅读 · 2012年12月31日

排序问题的博弈分析和多目标排序

国家自然科学基金

1+阅读 · 2009年12月31日

ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented Visual Models

Arxiv

0+阅读 · 2022年4月20日

A Polyhedral Abstraction for Petri nets and its Application to SMT-Based Model Checking

A Polyhedral Abstraction for Petri nets and its Application to SMT-Based Model Checking

Arxiv

0+阅读 · 2022年4月19日

Optimal bounds for numerical approximations of infinite horizon problems based on dynamic programming approach

Arxiv

1+阅读 · 2022年4月19日

Supervised Contrastive Learning for Recommendation

Arxiv

0+阅读 · 2022年4月19日

An Intuitive Tutorial to Gaussian Processes Regression

Arxiv

0+阅读 · 2022年4月18日

Interpretable Machine Learning: Fundamental Principles and 10 Grand Challenges

Arxiv

17+阅读 · 2021年7月10日

Recent Advances in Large Margin Learning

Arxiv

12+阅读 · 2021年3月25日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关主题

分布式强化学习

强化学习理论

相关VIP内容

重磅! 机器学习2022新书第三部来了！谷歌大牛Murphy新书《概率机器学习：高级主题》,1350页pdf！

重磅! 机器学习2022新书第三部来了！谷歌大牛Murphy新书《概率机器学习：高级主题》,1350页pdf！

专知会员服务

209+阅读 · 2022年3月1日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

73+阅读 · 2021年12月23日

【新书】统计学傻瓜式入门第二版，451页pdf

【新书】统计学傻瓜式入门第二版，451页pdf

专知会员服务

111+阅读 · 2021年11月5日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知会员服务

49+阅读 · 2021年10月21日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【2021新书】机器学习基础，400页pdf概述监督、无监督与高级技术

【2021新书】机器学习基础，400页pdf概述监督、无监督与高级技术

专知会员服务

112+阅读 · 2021年5月27日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

111+阅读 · 2020年11月12日

最新《机器学习：基本原理》2021新书，209页pdf

最新《机器学习：基本原理》2021新书，209页pdf

专知会员服务

134+阅读 · 2020年10月24日

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

361+阅读 · 2020年6月24日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

231+阅读 · 2020年4月28日

热门VIP内容

开通专知VIP会员享更多权益服务

从社会学实验到行为仿真：理解基于Agent的观点动力学建模思维

中英文版《GPT-5 System Card速览》报告

ACL 2025 | 大模型结构化知识提示的泛化能力研究

【普林斯顿博士论文】大型模型的高效推理

相关资讯

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知

4+阅读 · 2021年11月21日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知

45+阅读 · 2021年11月12日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知

4+阅读 · 2021年10月21日

干货书《金融数学导论: 概念与计算方法》，290页pdf

干货书《金融数学导论: 概念与计算方法》，290页pdf

专知

4+阅读 · 2021年5月7日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知

2+阅读 · 2021年3月30日

【经典书】线性代数，436页pdf

【经典书】线性代数，436页pdf

专知

3+阅读 · 2021年3月16日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

相关基金

随机辛算法和多辛算法

国家自然科学基金

2+阅读 · 2014年12月31日

非期望效用理论框架下的金融随机优化问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定性条件下环境导向的城市交通出行结构优化及调控策略研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多目标蚁群算法的农村居民点布局优化研究

国家自然科学基金

0+阅读 · 2013年12月31日

图的能量与排序问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

随机非线性切换系统的智能优化控制器设计及性能分析

国家自然科学基金

0+阅读 · 2012年12月31日

复杂多自主体系统的分析、优化与调控

国家自然科学基金

0+阅读 · 2012年12月31日

基于策略迭代算法的随机Markov跳变系统优化控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

随机微分博弈及其应用研究

国家自然科学基金

5+阅读 · 2012年12月31日

排序问题的博弈分析和多目标排序

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented Visual Models

Arxiv

0+阅读 · 2022年4月20日

A Polyhedral Abstraction for Petri nets and its Application to SMT-Based Model Checking

A Polyhedral Abstraction for Petri nets and its Application to SMT-Based Model Checking

Arxiv

0+阅读 · 2022年4月19日

Optimal bounds for numerical approximations of infinite horizon problems based on dynamic programming approach

Arxiv

1+阅读 · 2022年4月19日

Supervised Contrastive Learning for Recommendation

Arxiv

0+阅读 · 2022年4月19日

An Intuitive Tutorial to Gaussian Processes Regression

Arxiv

0+阅读 · 2022年4月18日

Interpretable Machine Learning: Fundamental Principles and 10 Grand Challenges

Arxiv

17+阅读 · 2021年7月10日

Recent Advances in Large Margin Learning

Arxiv

12+阅读 · 2021年3月25日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

大家都在搜

大型语言模型

无人机集群

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员