深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习,人工智能体通过学习来解决顺序决策问题。在过去的十年中,深度RL在一系列问题上取得了显著的成果,从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。
《深度强化学习基础》是对深度学习的介绍,独特地结合了理论和实现。它从直觉开始,然后仔细地解释了深度RL算法的理论,讨论了其伴生软件库SLM Lab中的实现,最后介绍了使深度RL工作的实际细节。
本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。
理解深度RL问题的每个关键方面
探索基于策略和价值的算法,包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER)
深入研究组合算法,包括actor - critical和近端策略优化(PPO)
理解如何同步和异步并行算法
在SLM Lab中运行算法,学习深入RL工作的实际实现细节
探索调优超参数的算法基准测试结果
理解深度RL环境是如何设计的
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“R413” 就可以获取《【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf》专知下载链接