强化学习是一种学习范式,它关注的是如何控制一个系统,从而最大化一个表示长期目标的数值性能度量。强化学习与监督学习的区别在于,对于学习器的预测,只会给予部分反馈。此外,这些预测可能通过影响被控制系统的未来状态而产生长期影响。因此,时间扮演着特殊的角色。强化学习的目标是发展有效的学习算法,以及了解算法的优点和局限性。强化学习之所以引起人们极大的兴趣,是因为它可以用于解决大量的实际应用,从人工智能到运筹学或控制工程的问题。在这本书中,我们专注于那些建立在强大的动态规划理论基础上的强化学习算法。我们给出了一个相当全面的学习问题的目录,描述了核心思想,关注大量的最先进的算法,然后讨论了它们的理论性质和局限性。

https://sites.ualberta.ca/~szepesva/rlbook.html

成为VIP会员查看完整内容
127

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
253+阅读 · 2021年10月8日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
94+阅读 · 2021年7月3日
专知会员服务
82+阅读 · 2021年5月4日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
自然语言处理现代方法,176页pdf
专知会员服务
268+阅读 · 2021年2月22日
专知会员服务
115+阅读 · 2020年12月17日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
354+阅读 · 2020年6月24日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
174+阅读 · 2020年2月8日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
经典书《斯坦福大学-多智能体系统》532页pdf
这三个博弈论新趋势,正深刻影响深度强化学习
AI科技评论
8+阅读 · 2019年11月26日
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
强化学习的入门之旅
机器学习研究会
7+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
【强化学习】易忽略的强化学习知识之基础知识及MDP
产业智能官
19+阅读 · 2017年12月22日
Arxiv
0+阅读 · 2021年10月15日
Credibility-based Fake News Detection
Arxiv
3+阅读 · 2019年11月2日
VIP会员
相关VIP内容
专知会员服务
253+阅读 · 2021年10月8日
【开放书】《矩阵流形优化算法》,241页pdf
专知会员服务
94+阅读 · 2021年7月3日
专知会员服务
82+阅读 · 2021年5月4日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
自然语言处理现代方法,176页pdf
专知会员服务
268+阅读 · 2021年2月22日
专知会员服务
115+阅读 · 2020年12月17日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
354+阅读 · 2020年6月24日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
174+阅读 · 2020年2月8日
相关资讯
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
经典书《斯坦福大学-多智能体系统》532页pdf
这三个博弈论新趋势,正深刻影响深度强化学习
AI科技评论
8+阅读 · 2019年11月26日
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
强化学习的入门之旅
机器学习研究会
7+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
【强化学习】易忽略的强化学习知识之基础知识及MDP
产业智能官
19+阅读 · 2017年12月22日
微信扫码咨询专知VIP会员