人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动,而被具有消极后果的决定所阻碍。这种强化过程可以应用到计算机程序中,使它们能够解决经典编程所不能解决的更复杂的问题。深度强化学习实战教你基本概念和术语的深度强化学习,以及实践技能和技术,你将需要把它落实到你自己的项目。

对这项技术

深度强化学习是一种机器学习的形式,人工智能智能体从自己的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并使用这些信息优化其行为以获得最大的长期回报。众所周知,深度强化学习对AlphaGo的成功做出了贡献,但这并不是它所能做的全部!更令人兴奋的应用程序等待被发现。让我们开始吧。

关于这本书

深度强化学习实战中教你如何编程的代理人,学习和改善的直接反馈,从他们的环境。您将使用流行的PyTorch深度学习框架构建网络,以探索从深度Q-Networks到策略梯度方法再到进化算法的强化学习算法。在你进行的过程中,你会将你所知道的应用到实际操作项目中,比如控制模拟机器人、自动化股票市场交易,甚至构建一个可以下围棋的机器人。

里面有什么

  • 将问题组织成马尔可夫决策过程
  • 深度Q网络、策略梯度法、进化算法等流行算法及其驱动算法的直觉
  • 将强化学习算法应用于实际问题
成为VIP会员查看完整内容
230

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《强化学习》简介小册,24页pdf
专知会员服务
209+阅读 · 2020年4月19日
【Manning2020新书】Elm 实战,344页pdf,Elm in Action
专知会员服务
38+阅读 · 2020年4月14日
【强化学习】深度强化学习初学者指南
专知会员服务
143+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
202+阅读 · 2019年10月9日
深度强化学习简介
专知
28+阅读 · 2018年12月3日
OpenAI强化学习实战
炼数成金订阅号
7+阅读 · 2018年5月14日
入门 | 通过 Q-learning 深入理解强化学习
机器之心
10+阅读 · 2018年4月17日
Arxiv
3+阅读 · 2018年10月5日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
6+阅读 · 2018年9月25日
Image Captioning based on Deep Reinforcement Learning
Relational Deep Reinforcement Learning
Arxiv
6+阅读 · 2018年6月28日
Arxiv
4+阅读 · 2018年6月12日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
16+阅读 · 2018年3月28日
VIP会员
相关VIP内容
《强化学习》简介小册,24页pdf
专知会员服务
209+阅读 · 2020年4月19日
【Manning2020新书】Elm 实战,344页pdf,Elm in Action
专知会员服务
38+阅读 · 2020年4月14日
【强化学习】深度强化学习初学者指南
专知会员服务
143+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
202+阅读 · 2019年10月9日
相关论文
Arxiv
3+阅读 · 2018年10月5日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
6+阅读 · 2018年9月25日
Image Captioning based on Deep Reinforcement Learning
Relational Deep Reinforcement Learning
Arxiv
6+阅读 · 2018年6月28日
Arxiv
4+阅读 · 2018年6月12日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
16+阅读 · 2018年3月28日
微信扫码咨询专知VIP会员