地址:
https://www.manning.com/books/deep-reinforcement-learning-in-action
人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动,而被具有消极后果的决定所阻碍。这种强化过程可以应用到计算机程序中,使它们能够解决经典编程所不能解决的更复杂的问题。深度强化学习实战教你基本概念和术语的深度强化学习,以及实践技能和技术,你将需要把它落实到你自己的项目。
对这项技术
深度强化学习是一种机器学习的形式,人工智能智能体从自己的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并使用这些信息优化其行为以获得最大的长期回报。众所周知,深度强化学习对AlphaGo的成功做出了贡献,但这并不是它所能做的全部!更令人兴奋的应用程序等待被发现。让我们开始吧。
关于这本书
深度强化学习实战中教你如何编程的代理人,学习和改善的直接反馈,从他们的环境。您将使用流行的PyTorch深度学习框架构建网络,以探索从深度Q-Networks到策略梯度方法再到进化算法的强化学习算法。在你进行的过程中,你会将你所知道的应用到实际操作项目中,比如控制模拟机器人、自动化股票市场交易,甚至构建一个可以下围棋的机器人。
里面有什么
将问题组织成马尔可夫决策过程
深度Q网络、策略梯度法、进化算法等流行算法及其驱动算法的直觉
将强化学习算法应用于实际问题
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DRLA” 就可以获取《【Manning2020新书】深度强化学习实战,351页pdf,Deep Reinforcement Learning》论文专知下载链接