深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习,人工智能体通过学习来解决顺序决策问题。在过去的十年中,深度RL在一系列问题上取得了显著的成果,从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。
《深度强化学习基础》是对深度学习的介绍,独特地结合了理论和实现。它从直觉开始,然后仔细地解释了深度RL算法的理论,讨论了其伴生软件库SLM Lab中的实现,最后介绍了使深度RL工作的实际细节。 本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。
理解深度RL问题的每个关键方面 * 探索基于策略和价值的算法,包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER) * 深入研究组合算法,包括actor - critical和近端策略优化(PPO) * 理解如何同步和异步并行算法 * 在SLM Lab中运行算法,学习深入RL工作的实际实现细节 * 探索调优超参数的算法基准测试结果 * 理解深度RL环境是如何设计的