最近强化学习(RL)与深度学习(DL)相结合,在训练智能体以类似人类的方式解决复杂问题方面取得了前所未有的进展。谷歌使用算法来玩并击败著名的雅达利街机游戏,使该领域变得突出,研究人员正在以快速的速度产生新的想法。 Deep Reinforcement Learning hands是一本关于最新深度学习工具及其局限性的全面指南。在将交叉熵和策略梯度等方法应用于现实环境之前,您将对它们进行评估。比如雅达利(Atari)的虚拟游戏和家庭最喜欢的Connect4。 本书介绍了RL的基础知识,为你提供了编写智能学习智能体的诀窍,以承担一系列艰巨的实际任务。了解如何在grid world
环境中实现Q-learning,教您的智能体购买和交易股票,并了解自然语言模型如何推动聊天机器人的繁荣。 目录内容:
Chapter 2: OpenAI Gym * Chapter 3: Deep Learning with PyTorch * Chapter 4: Cross Entropy method * Chapter 5: Tabular learning and the Bellman equation * Chapter 6: Deep Q-Networks * Chapter 7: DQN extensions * Chapter 8: Stocks trading using RL * Chapter 9: Policy Gradients: an alternative * Chapter 10: Actor-Critic method * Chapter 11: Asynchronous Advantage Actor-Critic * Chapter 12: Chatbots traning with RL * Chapter 13: Web navigation * Chapter 14: Continuous action space * Chapter 15: Trust regions: TRPO, PPO and ACKTR * Chapter 16: Black-box optimisation in RL * Chapter 17: Beyond model-free: imagination * Chapter 18: AlphaGo Zero