强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
  1. 集智
  2. 强化学习 Reinforcement Learning 教程系列 | 莫烦Python
  3. 基于tensorflow的最简单的强化学习入门-part0:Q-learning...
  4. 【量化策略】当Trading遇上Reinforcement Learning
  5. Deep Reinforcement Learning 深度增强学习资源 (持续更新)
  6. 重现DeepMind星际争霸强化学习算法
  7. Deep Reinforcement Learning 深度增强学习资源 (持续更新)
  8. 深度增强学习方向论文整理
  9. 神经网络的学习方法概述 - Bill's Blog
  10. 模仿学习(Imitation Learning)完全介绍(一)
  11. Kevin Chan's blog - 强化学习基础实验(3)——Windy...
  12. Kevin Chan's blog - 强化学习基础实验(4)——Cliff Walking
  13. Deep Reinforcement Learning: Pong from Pixels
  14. [13] modular multitask reinforcement learning...
  15. Kevin Chan's blog - 强化学习指南
  16. Kevin Chan's blog - 强化学习基础实验(1)——Gridworld
  17. Kevin Chan's blog - 强化学习基础实验(5)——Moutain Car
  18. NLP相关学习资料 | YangYangKang's blog
  19. 一些RL的文献(及笔记) | Deep Q-Learning
  20. DDPG《Continuous control with deep reinforcement...
展开全文
微信扫码咨询专知VIP会员