结合进化算法的深度强化学习方法研究综述 - 专知

会员服务 ·

0

结合进化算法的深度强化学习方法研究综述

2022 年 7 月 16 日 专知

深度强化学习是目前机器学习领域中重要的研究分支之一，它可以通过直接与环境进行交互实现端到端的学习，对高维度和大规模的问题有着很好的解决能力．虽然深度强化学习已经取得了瞩目的成果，但其仍面临着对环境探索能力不足、鲁棒性差、容易受到由欺骗性奖励导致的欺骗性梯度影响等问题．进化算法普遍具有较好的全局搜索能力、良好的鲁棒性和并行性等优点，因此将进化算法与深度强化学习结合用于弥补深度强化学习不足的方法成为了当前研究的热点．该文主要关注进化算法在无模型的深度强化学习方法中的应用，首先简单介绍了进化算法和强化学习基本方法，之后详细阐述了两类结合进化算法的强化学习方法，分别是进化算法引导策略搜索的强化学习和结合进化算法的深度强化学习，同时对这些方法进行了对比与分析，最后对该领域的研究重点和发展趋势进行了探究．

长期以来，强化学习都是机器学习方法中不可或缺的一部分，在国际上也一直是机器学习领域中炙手可热的研究分支．在强化学习中，智能体首先根据环境状态进行决策从而产生动作，之后通过产生的动作与环境进行交互获得强化信号，调整产生决策的函数映射，使得智能体能够选择获得环境最大奖励的决策方案．智能体经过长期与环境的交互，不断向累积回报最大的方向优化策略，最终使累积回报尽可能地最大化．2013年，DeepMind团队的 Mnih 等人首先将传统强化学习中的Q-Learning算法［１］与深度神经网络相结合，并提出了深度Ｑ网络（Deep Q-Network，ＤＱＮ）算法［２３］，使用ＤＱＮ算法训练的智能体在Atari游戏中取得了超过人类得分的惊人表现．这一成果开拓了深度强化学习这一新的方向，并成为了当今人工智能领域新的研究热点．深度强化学习是一种端到端的学习方法，它不需要标记的数据作为输入，而是通过与环境进行交互获取原始输入信息，从而学习动作策略，通过不断的试错形成具有强大学习能力的智能体［４］．2016年，DeepMind团队使用深度强化学习训练的AlphaGo智能体［５］击败了人类最顶尖的围棋选手，是机器学习领域的重大标志性事件，使得深度强化学习成为研究者们关注的焦点．目前深度强化学习在机器博弈［５７］、机器人控制［８］、自然语言处理［９］、最优控制［１０］和计算机视觉［１］等领域中取得了广泛的应用，被认为是通向通用人工智能的重要方法之一［１２］．

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“EDRL” 就可以获取《结合进化算法的深度强化学习方法研究综述》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

3

相关内容

进化算法

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

基于强化学习的知识图谱综述

基于强化学习的知识图谱综述

专知会员服务

203+阅读 · 2022年8月20日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

强化学习可解释性基础问题探索和方法综述

强化学习可解释性基础问题探索和方法综述

专知会员服务

91+阅读 · 2022年1月16日

多智能体深度强化学习：综述

专知会员服务

170+阅读 · 2021年8月3日

无模型强化学习研究综述

专知会员服务

134+阅读 · 2021年3月13日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

116+阅读 · 2021年1月1日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

基于深度强化学习的作战辅助决策研究

基于深度强化学习的作战辅助决策研究

专知

7+阅读 · 2022年6月8日

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知

1+阅读 · 2022年2月1日

深度强化学习的攻防与安全性分析综述

深度强化学习的攻防与安全性分析综述

专知

1+阅读 · 2022年1月16日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

群体行为识别深度学习方法研究综述

群体行为识别深度学习方法研究综述

专知

0+阅读 · 2021年11月29日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

PaperWeekly

5+阅读 · 2021年11月20日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

认知天波超视距雷达低可探测目标检测方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于强化学习的前列腺癌蛋白质间相互作用网络的模型及方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

类进化计算研究：基于可达特性分析的类进化算法理论与应用

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

异质进化算法集成研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于数学规划的解高维多目标优化问题的异步并行进化算法

国家自然科学基金

0+阅读 · 2010年12月31日

Robust Geometric Metric Learning

Arxiv

0+阅读 · 2022年9月12日

Deep Learning for Medical Image Registration: A Comprehensive Review

Arxiv

20+阅读 · 2022年4月24日

Efficient Transformers: A Survey

Arxiv

35+阅读 · 2022年3月14日

Imitation Learning: Progress, Taxonomies and Opportunities

Arxiv

12+阅读 · 2021年6月23日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

18+阅读 · 2021年6月17日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

VIP会员

相关主题

深度强化学习

相关VIP内容

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

基于强化学习的知识图谱综述

基于强化学习的知识图谱综述

专知会员服务

203+阅读 · 2022年8月20日

基于模型的强化学习综述

基于模型的强化学习综述

专知会员服务

148+阅读 · 2022年7月13日

强化学习可解释性基础问题探索和方法综述

强化学习可解释性基础问题探索和方法综述

专知会员服务

91+阅读 · 2022年1月16日

多智能体深度强化学习：综述

专知会员服务

170+阅读 · 2021年8月3日

无模型强化学习研究综述

专知会员服务

134+阅读 · 2021年3月13日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

116+阅读 · 2021年1月1日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

基于深度强化学习的作战辅助决策研究

基于深度强化学习的作战辅助决策研究

专知

7+阅读 · 2022年6月8日

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知

1+阅读 · 2022年2月1日

深度强化学习的攻防与安全性分析综述

深度强化学习的攻防与安全性分析综述

专知

1+阅读 · 2022年1月16日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

群体行为识别深度学习方法研究综述

群体行为识别深度学习方法研究综述

专知

0+阅读 · 2021年11月29日

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

PaperWeekly

5+阅读 · 2021年11月20日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

认知天波超视距雷达低可探测目标检测方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于强化学习的前列腺癌蛋白质间相互作用网络的模型及方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

类进化计算研究：基于可达特性分析的类进化算法理论与应用

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

异质进化算法集成研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于数学规划的解高维多目标优化问题的异步并行进化算法

国家自然科学基金

0+阅读 · 2010年12月31日

相关论文

Robust Geometric Metric Learning

Arxiv

0+阅读 · 2022年9月12日

Deep Learning for Medical Image Registration: A Comprehensive Review

Arxiv

20+阅读 · 2022年4月24日

Efficient Transformers: A Survey

Arxiv

35+阅读 · 2022年3月14日

Imitation Learning: Progress, Taxonomies and Opportunities

Arxiv

12+阅读 · 2021年6月23日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

18+阅读 · 2021年6月17日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

A Comprehensive Survey on Graph Neural Networks

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

大家都在搜

无人机集群

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员