多智能体深度强化学习的若干关键科学问题 - 专知

会员服务 ·

0

多智能体深度强化学习的若干关键科学问题

2020 年 5 月 24 日 专知

摘要: 强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战. 近年来, 深度学习迅猛发展, 使得强化学习方法为复杂高维的多智能体系统提供优化的决策策略、在充满挑战的环境中高效执行目标任务成为可能. 本文综述了强化学习和深度强化学习方法的原理, 提出学习系统的闭环控制框架, 分析了多智能体深度强化学习中存在的若干重要问题和解决方法, 包括多智能体强化学习的算法结构、环境非静态和部分可观性等问题, 对所调查方法的优缺点和相关应用进行分析和讨论. 最后提供多智能体深度强化学习未来的研究方向, 为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路.

http://www.aas.net.cn/cn/article/id/41ddf9f1-8977-45c9-b63b-e62e8f18059f

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ MARL” 可以获取《多智能体深度强化学习的若干关键科学问题 》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“阅读原文”，了解使用专知，查看获取5000+AI主题知识资源

登录查看更多

2

相关内容

多智能体

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

专知会员服务

38+阅读 · 2020年6月3日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

人机对抗智能技术

人机对抗智能技术

专知会员服务

213+阅读 · 2020年5月3日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

中科大-人工智能方向专业课程2020《脑与认知科学导论》

中科大-人工智能方向专业课程2020《脑与认知科学导论》

专知会员服务

125+阅读 · 2020年3月4日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

【资源】元学习论文分类列表推荐

【资源】元学习论文分类列表推荐

专知

19+阅读 · 2019年12月3日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【资源】图深度学习文献列表

【资源】图深度学习文献列表

专知

42+阅读 · 2019年11月6日

【PPT】大规模网络的社区检测和排序问题综述

【PPT】大规模网络的社区检测和排序问题综述

专知

12+阅读 · 2019年5月30日

【MIT重磅课程6.883】深度学习科学: 桥接理论与实践

【MIT重磅课程6.883】深度学习科学: 桥接理论与实践

专知

9+阅读 · 2019年3月27日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

PyTorch实现多种深度强化学习算法

PyTorch实现多种深度强化学习算法

专知

36+阅读 · 2019年1月15日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

Meta Learning for Task-Driven Video Summarization

Arxiv

6+阅读 · 2019年7月29日

An End-to-End Baseline for Video Captioning

Arxiv

6+阅读 · 2019年4月4日

Visualization and Interpretation of Latent Spaces for Controlling Expressive Speech Synthesis through Audio Analysis

Visualization and Interpretation of Latent Spaces for Controlling Expressive Speech Synthesis through Audio Analysis

Arxiv

4+阅读 · 2019年3月27日

Jointly Optimizing Diversity and Relevance in Neural Response Generation

Arxiv

4+阅读 · 2019年2月28日

Learning latent representations for style control and transfer in end-to-end speech synthesis

Learning latent representations for style control and transfer in end-to-end speech synthesis

Arxiv

5+阅读 · 2019年2月14日

Representation Learning with Contrastive Predictive Coding

Arxiv

6+阅读 · 2019年1月22日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Viewpoint Estimation-Insights & Model

Viewpoint Estimation-Insights & Model

Arxiv

3+阅读 · 2018年7月3日

VIP会员

相关主题

深度强化学习

多智能体强化学习

相关VIP内容

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

专知会员服务

38+阅读 · 2020年6月3日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

人机对抗智能技术

人机对抗智能技术

专知会员服务

213+阅读 · 2020年5月3日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

中科大-人工智能方向专业课程2020《脑与认知科学导论》

中科大-人工智能方向专业课程2020《脑与认知科学导论》

专知会员服务

125+阅读 · 2020年3月4日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【资源】元学习论文分类列表推荐

【资源】元学习论文分类列表推荐

专知

19+阅读 · 2019年12月3日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【资源】图深度学习文献列表

【资源】图深度学习文献列表

专知

42+阅读 · 2019年11月6日

【PPT】大规模网络的社区检测和排序问题综述

【PPT】大规模网络的社区检测和排序问题综述

专知

12+阅读 · 2019年5月30日

【MIT重磅课程6.883】深度学习科学: 桥接理论与实践

【MIT重磅课程6.883】深度学习科学: 桥接理论与实践

专知

9+阅读 · 2019年3月27日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

PyTorch实现多种深度强化学习算法

PyTorch实现多种深度强化学习算法

专知

36+阅读 · 2019年1月15日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

相关论文

Meta Learning for Task-Driven Video Summarization

Arxiv

6+阅读 · 2019年7月29日

An End-to-End Baseline for Video Captioning

Arxiv

6+阅读 · 2019年4月4日

Visualization and Interpretation of Latent Spaces for Controlling Expressive Speech Synthesis through Audio Analysis

Visualization and Interpretation of Latent Spaces for Controlling Expressive Speech Synthesis through Audio Analysis

Arxiv

4+阅读 · 2019年3月27日

Jointly Optimizing Diversity and Relevance in Neural Response Generation

Arxiv

4+阅读 · 2019年2月28日

Learning latent representations for style control and transfer in end-to-end speech synthesis

Learning latent representations for style control and transfer in end-to-end speech synthesis

Arxiv

5+阅读 · 2019年2月14日

Representation Learning with Contrastive Predictive Coding

Arxiv

6+阅读 · 2019年1月22日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Viewpoint Estimation-Insights & Model

Viewpoint Estimation-Insights & Model

Arxiv

3+阅读 · 2018年7月3日

大家都在搜

国防科技创新

CMU博士论文

无人机集群

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员