【强化学习最新综述】详解强化学习当前进展及未来方向 - 专知

会员服务 ·

0

【强化学习最新综述】详解强化学习当前进展及未来方向

2020 年 1 月 23 日 专知

【导读】强化学习最新综述新鲜出炉。在这篇文章中，作者对强化学习进行了全面的研究，包括现有的挑战、不同技术的最新发展以及未来的发展方向。文章致力于提供一个清晰简单的研究框架，能够为新的研究人员或者想全面了解强化学习领域的人提供一个参考。

摘要：
强化学习是设计强调实时响应的人工智能系统的核心组成部分之一。强化学习能够影响系统在任意的环境中的行动，不管它之前是否了解环境模型。在这篇论文中，我们对强化学习进行了全面的研究，包括了现有挑战、不同技术的最新发展情况以及未来的发展方向等多个维度。本论文的基本目标是提供一个足够简单和清晰的框架，以介绍现有的强化学习方法，从而为新的研究人员和学者了解该领域的核心进展。首先，我们以一种易于理解和比较的方式阐述了强化学习的核心技术。然后，我们分析并描述了强化学习方法的最新发展。我们的分析指出，大多数模型关注于调优策略值，而不是在特定的推理状态下调优其他东西。

地址：

https://www.zhuanzhi.ai/paper/060f307a0f77cb7abf98b0162fd8a928

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RL0123” 就可以获取《最新强化学习综述》专知资源链接索引

部分文章：

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RL0123” 就可以获取《最新强化学习综述》专知资源链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“阅读原文”，了解使用专知，查看获取5000+AI主题知识资料

登录查看更多

8

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

综述：可解释的知识系统发展方向，附17页论文下载

专知会员服务

102+阅读 · 2020年3月19日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

自动机器学习：最新进展综述

自动机器学习：最新进展综述

专知会员服务

123+阅读 · 2019年10月13日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【旷视出品】细粒度图像分析综述

【旷视出品】细粒度图像分析综述

专知

15+阅读 · 2019年7月11日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

专知

32+阅读 · 2019年5月22日

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

专知

54+阅读 · 2019年4月24日

对话系统近期进展

对话系统近期进展

专知

37+阅读 · 2019年3月23日

106页《深度CNN-目标检测》综述进展论文

106页《深度CNN-目标检测》综述进展论文

专知

4+阅读 · 2018年9月30日

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Arxiv

40+阅读 · 2019年6月4日

Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning

Arxiv

7+阅读 · 2019年3月21日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Video Person Re-identification by Temporal Residual Learning

Arxiv

5+阅读 · 2018年2月22日

Reinforcement Learning based Recommender System using Biclustering Technique

Arxiv

5+阅读 · 2018年1月17日

VIP会员

相关主题

人工智能系统

相关VIP内容

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

综述：可解释的知识系统发展方向，附17页论文下载

专知会员服务

102+阅读 · 2020年3月19日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

语音处理中的深度表示学习综述论文:挑战、最新进展和未来趋势，25页pdf

专知会员服务

32+阅读 · 2020年1月2日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

275+阅读 · 2020年1月1日

自动机器学习：最新进展综述

自动机器学习：最新进展综述

专知会员服务

123+阅读 · 2019年10月13日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型基准综述

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

【剑桥博士论文】多智能体学习中的神经多样性

以色列-伊朗空战：短暂而激烈冲突的启示

相关资讯

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【旷视出品】细粒度图像分析综述

【旷视出品】细粒度图像分析综述

专知

15+阅读 · 2019年7月11日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

专知

32+阅读 · 2019年5月22日

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

专知

54+阅读 · 2019年4月24日

对话系统近期进展

对话系统近期进展

专知

37+阅读 · 2019年3月23日

106页《深度CNN-目标检测》综述进展论文

106页《深度CNN-目标检测》综述进展论文

专知

4+阅读 · 2018年9月30日

相关论文

A Comprehensive Survey on Transfer Learning

A Comprehensive Survey on Transfer Learning

Arxiv

121+阅读 · 2019年11月7日

Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Arxiv

40+阅读 · 2019年6月4日

Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning

Arxiv

7+阅读 · 2019年3月21日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Video Person Re-identification by Temporal Residual Learning

Arxiv

5+阅读 · 2018年2月22日

Reinforcement Learning based Recommender System using Biclustering Technique

Arxiv

5+阅读 · 2018年1月17日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员