无模型强化学习研究综述 - 专知VIP

会员服务 ·

47

强化学习 · 无模型强化学习 · 深度强化学习 ·

2021 年 3 月 13 日

无模型强化学习研究综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习(ReinforcementLearning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化.常用的强化学习算法分为模型化强化学习(ModelＧbasedReinforcementLearＧ ning)和无模型强化学习(ModelＧfreeReinforcementLearning).模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互.在无模型强化学习中,智能体通过与环境进行实时交互来学习最优策略,该方法在实际任务中具有更好的通用性,因此应用范围更广.文中对无模型强化学习的最新研究进展与发展动态进行了综述.首先介绍了强化学习、模型化强化学习和无模型强化学习的基础理论;然后基于价值函数和策略函数归纳总结了无模型强化学习的经典算法及各自的优缺点;最后概述了无模型强化学习在游戏 AI、化学材料设计、自然语言处理和机器人控制领域的最新研究现状,并对无模型强化学习的未来发展趋势进行了展望.

成为VIP会员查看完整内容

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

时态规划综述及研究现状

专知会员服务

62+阅读 · 2021年5月4日

记忆增强型深度强化学习研究综述

专知会员服务

52+阅读 · 2021年4月6日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

流体运动估计光流算法研究综述

专知会员服务

32+阅读 · 2021年2月17日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

仿人智能控制理论及应用研究进展

专知会员服务

35+阅读 · 2020年11月26日

面向图的异常检测研究综述

专知会员服务

109+阅读 · 2020年10月27日

3D目标检测进展综述

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

知识图谱最新研究综述

知识图谱最新研究综述

深度学习自然语言处理

45+阅读 · 2020年6月14日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉life

9+阅读 · 2018年10月28日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

专知

5+阅读 · 2017年10月23日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

Interpretable Sequence Classification via Discrete Optimization

Arxiv

8+阅读 · 2020年10月6日

Learning Optimal Representations with the Decodable Information Bottleneck

Arxiv

6+阅读 · 2020年9月27日

A Survey on Trajectory Data Management, Analytics, and Learning

A Survey on Trajectory Data Management, Analytics, and Learning

Arxiv

16+阅读 · 2020年3月25日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Information-Directed Exploration for Deep Reinforcement Learning

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

Unsupervised Meta-Learning for Reinforcement Learning

Arxiv

8+阅读 · 2018年6月12日

Open Information Extraction on Scientific Text: An Evaluation

Arxiv

6+阅读 · 2018年2月15日

VIP会员

相关主题

无模型强化学习

深度强化学习

相关VIP内容

时态规划综述及研究现状

专知会员服务

62+阅读 · 2021年5月4日

记忆增强型深度强化学习研究综述

专知会员服务

52+阅读 · 2021年4月6日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

流体运动估计光流算法研究综述

专知会员服务

32+阅读 · 2021年2月17日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

仿人智能控制理论及应用研究进展

专知会员服务

35+阅读 · 2020年11月26日

面向图的异常检测研究综述

专知会员服务

109+阅读 · 2020年10月27日

3D目标检测进展综述

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

知识图谱最新研究综述

知识图谱最新研究综述

深度学习自然语言处理

45+阅读 · 2020年6月14日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉life

9+阅读 · 2018年10月28日

深度强化学习入门，这一篇就够了！

深度强化学习入门，这一篇就够了！

机器学习算法与Python学习

28+阅读 · 2018年8月17日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

专知

5+阅读 · 2017年10月23日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

相关论文

Interpretable Sequence Classification via Discrete Optimization

Arxiv

8+阅读 · 2020年10月6日

Learning Optimal Representations with the Decodable Information Bottleneck

Arxiv

6+阅读 · 2020年9月27日

A Survey on Trajectory Data Management, Analytics, and Learning

A Survey on Trajectory Data Management, Analytics, and Learning

Arxiv

16+阅读 · 2020年3月25日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Information-Directed Exploration for Deep Reinforcement Learning

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Energy-Based Hindsight Experience Prioritization

Arxiv

3+阅读 · 2018年10月8日

Unsupervised Meta-Learning for Reinforcement Learning

Arxiv

8+阅读 · 2018年6月12日

Open Information Extraction on Scientific Text: An Evaluation

Arxiv

6+阅读 · 2018年2月15日

微信扫码咨询专知VIP会员