多智能体深度强化学习的若干关键科学问题

2020 年 5 月 24 日 专知

摘要: 强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战. 近年来, 深度学习迅猛发展, 使得强化学习方法为复杂高维的多智能体系统提供优化的决策策略、在充满挑战的环境中高效执行目标任务成为可能. 本文综述了强化学习和深度强化学习方法的原理, 提出学习系统的闭环控制框架, 分析了多智能体深度强化学习中存在的若干重要问题和解决方法, 包括多智能体强化学习的算法结构、环境非静态和部分可观性等问题, 对所调查方法的优缺点和相关应用进行分析和讨论. 最后提供多智能体深度强化学习未来的研究方向, 为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路.


http://www.aas.net.cn/cn/article/id/41ddf9f1-8977-45c9-b63b-e62e8f18059f



专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
  • 后台回复“ MARL” 可以获取多智能体深度强化学习的若干关键科学问题 》专知下载链接索引
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

最新《生成式对抗网络》简介,25页ppt
专知会员服务
173+阅读 · 2020年6月28日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
中科大-人工智能方向专业课程2020《脑与认知科学导论》
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
专知会员服务
206+阅读 · 2019年8月30日
【资源】元学习论文分类列表推荐
专知
19+阅读 · 2019年12月3日
【资源】图深度学习文献列表
专知
42+阅读 · 2019年11月6日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
Arxiv
6+阅读 · 2019年7月29日
Arxiv
6+阅读 · 2019年4月4日
Arxiv
136+阅读 · 2018年10月8日
Paraphrase Generation with Deep Reinforcement Learning
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
VIP会员
相关VIP内容
最新《生成式对抗网络》简介,25页ppt
专知会员服务
173+阅读 · 2020年6月28日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
中科大-人工智能方向专业课程2020《脑与认知科学导论》
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
专知会员服务
206+阅读 · 2019年8月30日
相关资讯
【资源】元学习论文分类列表推荐
专知
19+阅读 · 2019年12月3日
【资源】图深度学习文献列表
专知
42+阅读 · 2019年11月6日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
Top
微信扫码咨询专知VIP会员