【导读】强化学习最新综述新鲜出炉。在这篇文章中,作者对强化学习进行了全面的研究,包括现有的挑战、不同技术的最新发展以及未来的发展方向。文章致力于提供一个清晰简单的研究框架,能够为新的研究人员或者想全面了解强化学习领域的人提供一个参考。

摘要: 强化学习是设计强调实时响应的人工智能系统的核心组成部分之一。强化学习能够影响系统在任意的环境中的行动,不管它之前是否了解环境模型。在这篇论文中,我们对强化学习进行了全面的研究,包括了现有挑战、不同技术的最新发展情况以及未来的发展方向等多个维度。本论文的基本目标是提供一个足够简单和清晰的框架,以介绍现有的强化学习方法,从而为新的研究人员和学者了解该领域的核心进展。首先,我们以一种易于理解和比较的方式阐述了强化学习的核心技术。然后,我们分析并描述了强化学习方法的最新发展。我们的分析指出,大多数模型关注于调优策略值,而不是在特定的推理状态下调优其他东西。

地址:

https://arxiv.org/abs/2001.06921

成为VIP会员查看完整内容
232

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
专知会员服务
197+阅读 · 2020年3月6日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
117+阅读 · 2019年12月26日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
零样本图像分类综述 : 十年进展
专知会员服务
122+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
225+阅读 · 2019年10月12日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
对话系统近期进展
专知
37+阅读 · 2019年3月23日
2018年深度学习优化算法最新综述
计算机视觉战队
9+阅读 · 2018年12月11日
综述 | 近年来深度学习的重要研究成果(附PDF)
数据派THU
14+阅读 · 2018年8月15日
A Modern Introduction to Online Learning
Arxiv
19+阅读 · 2019年12月31日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
21+阅读 · 2018年8月30日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
相关VIP内容
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
261+阅读 · 2020年4月19日
专知会员服务
197+阅读 · 2020年3月6日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
117+阅读 · 2019年12月26日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
零样本图像分类综述 : 十年进展
专知会员服务
122+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
225+阅读 · 2019年10月12日
相关资讯
相关论文
微信扫码咨询专知VIP会员