【新书】分布式强化学习，280页pdf - 专知VIP

会员服务 ·

70

分布式强化学习 · 书籍 ·

2021 年 12 月 19 日

【新书】分布式强化学习，280页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本书分为三个部分。第一部分介绍了分布式强化学习的构建模块。我们首先介绍了我们的基本研究对象，收益分布和分布Bellman方程(第二章)。第三章介绍了分类时间差分学习，一种简单的学习收益分布的算法。在第三章结束时，读者应该理解分布式强化学习的基本原则，并且应该能够在简单的实际设置中使用它。

第二部分是对分布式强化学习理论的发展。第4章介绍了一种用于测量返回分布之间距离的语言，以及与这些分布交互的操作符。第5章介绍了实现分布式强化学习所需的概率表示的概念;在此基础上，研究了用这种表示来计算和近似收益分布的问题，并引入了分布动态规划的框架。第6章研究了如何从样本中以增量的方式学习返回分布，给出了类别时间差分学习的正式结构，以及其他算法，如分位数时间差异学习。第7章将这些思想扩展到最优决策的设置(也称为控制设置)。最后，第8章介绍了基于统计泛函概念的分布强化学习的不同视角。在第二部分结束时，读者应该理解在设计分布式强化学习算法时出现的挑战，以及解决这些挑战的可用工具。

第三部分和最后一部分为实际场景ios开发了分布式强化学习。第九章回顾了线性值函数逼近的原理，并将这些思想推广到分布环境中。第10章讨论了如何将分布方法与深度神经网络相结合来获得深度强化学习的算法，并提出了一个模型来研究这种结合所产生的现象。第11章讨论了分布式强化学习在两个进一步研究领域(多主体学习和神经科学)的新兴应用，并得出结论。

https://www.distributional-rl.org/

成为VIP会员查看完整内容

相关内容

分布式强化学习

分布式强化学习

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

160+阅读 · 2021年9月15日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【经典书】半监督学习，524页pdf

【经典书】半监督学习，524页pdf

专知会员服务

138+阅读 · 2021年8月20日

【ICML2021】随机矩阵理论与机器学习，255页pdf

专知会员服务

119+阅读 · 2021年7月24日

【2021新书】金融机器学习，192页pdf

专知会员服务

232+阅读 · 2021年6月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

【MIT经典书】统计学习与序列预测，261页pdf

【MIT经典书】统计学习与序列预测，261页pdf

专知会员服务

78+阅读 · 2020年11月17日

【2020新书】傅里叶变换的离散代数，296页pdf

【2020新书】傅里叶变换的离散代数，296页pdf

专知会员服务

118+阅读 · 2020年11月2日

【经典书】概率统计导论第五版，730页pdf

【经典书】概率统计导论第五版，730页pdf

专知会员服务

248+阅读 · 2020年7月28日

【经典书】人工智能及机器学习导论，457页pdf

【经典书】人工智能及机器学习导论，457页pdf

专知会员服务

166+阅读 · 2020年7月5日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【2020新书】Python金融大数据分析宝典，426页pdf与代码

【2020新书】Python金融大数据分析宝典，426页pdf与代码

专知

9+阅读 · 2020年7月11日

【干货书】《机器学习导论(第二版)》，348页pdf

【干货书】《机器学习导论(第二版)》，348页pdf

专知

42+阅读 · 2020年6月16日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

圣经书||《强化学习导论(2nd)》原书、代码、习题答案、课程视频大全

圣经书||《强化学习导论(2nd)》原书、代码、习题答案、课程视频大全

专知

59+阅读 · 2020年3月5日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

177页《鲁棒机器学习》教程【下载】

177页《鲁棒机器学习》教程【下载】

机器学习算法与Python学习

8+阅读 · 2018年11月15日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

How Good are Low-Rank Approximations in Gaussian Process Regression?

Arxiv

0+阅读 · 2022年2月21日

Double Thompson Sampling in Finite stochastic Games

Arxiv

0+阅读 · 2022年2月21日

Cutting feedback and modularized analyses in generalized Bayesian inference

Arxiv

0+阅读 · 2022年2月21日

Deep kernel machines: exact inference with representation learning in infinite Bayesian neural networks

Arxiv

0+阅读 · 2022年2月19日

Hyperparameter Selection Methods for Fitted Q-Evaluation with Error Guarantee

Arxiv

0+阅读 · 2022年2月18日

Negative Sample Matters: A Renaissance of Metric Learning for Temporal Grounding

Arxiv

8+阅读 · 2021年12月15日

GFlowNet Foundations

GFlowNet Foundations

Arxiv

9+阅读 · 2021年11月17日

Federated Learning with Fair Averaging

Arxiv

7+阅读 · 2021年4月30日

Scale-Aware Trident Networks for Object Detection

Scale-Aware Trident Networks for Object Detection

Arxiv

4+阅读 · 2019年1月7日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

VIP会员

相关主题

分布式强化学习

相关VIP内容

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

160+阅读 · 2021年9月15日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【经典书】半监督学习，524页pdf

【经典书】半监督学习，524页pdf

专知会员服务

138+阅读 · 2021年8月20日

【ICML2021】随机矩阵理论与机器学习，255页pdf

专知会员服务

119+阅读 · 2021年7月24日

【2021新书】金融机器学习，192页pdf

专知会员服务

232+阅读 · 2021年6月3日

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知会员服务

239+阅读 · 2020年12月15日

【MIT经典书】统计学习与序列预测，261页pdf

【MIT经典书】统计学习与序列预测，261页pdf

专知会员服务

78+阅读 · 2020年11月17日

【2020新书】傅里叶变换的离散代数，296页pdf

【2020新书】傅里叶变换的离散代数，296页pdf

专知会员服务

118+阅读 · 2020年11月2日

【经典书】概率统计导论第五版，730页pdf

【经典书】概率统计导论第五版，730页pdf

专知会员服务

248+阅读 · 2020年7月28日

【经典书】人工智能及机器学习导论，457页pdf

【经典书】人工智能及机器学习导论，457页pdf

专知会员服务

166+阅读 · 2020年7月5日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型基准综述

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

【剑桥博士论文】多智能体学习中的神经多样性

以色列-伊朗空战：短暂而激烈冲突的启示

相关资讯

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

【2020新书】《金融机器学习：从理论到实践》，附565页pdf与随书代码

专知

39+阅读 · 2020年12月15日

【2020新书】Python金融大数据分析宝典，426页pdf与代码

【2020新书】Python金融大数据分析宝典，426页pdf与代码

专知

9+阅读 · 2020年7月11日

【干货书】《机器学习导论(第二版)》，348页pdf

【干货书】《机器学习导论(第二版)》，348页pdf

专知

42+阅读 · 2020年6月16日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

圣经书||《强化学习导论(2nd)》原书、代码、习题答案、课程视频大全

圣经书||《强化学习导论(2nd)》原书、代码、习题答案、课程视频大全

专知

59+阅读 · 2020年3月5日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

177页《鲁棒机器学习》教程【下载】

177页《鲁棒机器学习》教程【下载】

机器学习算法与Python学习

8+阅读 · 2018年11月15日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

相关论文

How Good are Low-Rank Approximations in Gaussian Process Regression?

Arxiv

0+阅读 · 2022年2月21日

Double Thompson Sampling in Finite stochastic Games

Arxiv

0+阅读 · 2022年2月21日

Cutting feedback and modularized analyses in generalized Bayesian inference

Arxiv

0+阅读 · 2022年2月21日

Deep kernel machines: exact inference with representation learning in infinite Bayesian neural networks

Arxiv

0+阅读 · 2022年2月19日

Hyperparameter Selection Methods for Fitted Q-Evaluation with Error Guarantee

Arxiv

0+阅读 · 2022年2月18日

Negative Sample Matters: A Renaissance of Metric Learning for Temporal Grounding

Arxiv

8+阅读 · 2021年12月15日

GFlowNet Foundations

GFlowNet Foundations

Arxiv

9+阅读 · 2021年11月17日

Federated Learning with Fair Averaging

Arxiv

7+阅读 · 2021年4月30日

Scale-Aware Trident Networks for Object Detection

Scale-Aware Trident Networks for Object Detection

Arxiv

4+阅读 · 2019年1月7日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

微信扫码咨询专知VIP会员