人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动,而被具有消极后果的决定所阻碍。这种强化过程可以应用到计算机程序中,使它们能够解决经典编程所不能解决的更复杂的问题。深度强化学习实战教你基本概念和术语的深度强化学习,以及实践技能和技术,你将需要把它落实到你自己的项目。
对这项技术
深度强化学习是一种机器学习的形式,人工智能智能体从自己的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并使用这些信息优化其行为以获得最大的长期回报。众所周知,深度强化学习对AlphaGo的成功做出了贡献,但这并不是它所能做的全部!更令人兴奋的应用程序等待被发现。让我们开始吧。
关于这本书
深度强化学习实战中教你如何编程的代理人,学习和改善的直接反馈,从他们的环境。您将使用流行的PyTorch深度学习框架构建网络,以探索从深度Q-Networks到策略梯度方法再到进化算法的强化学习算法。在你进行的过程中,你会将你所知道的应用到实际操作项目中,比如控制模拟机器人、自动化股票市场交易,甚至构建一个可以下围棋的机器人。
里面有什么