开放环境下的协作多智能体强化学习进展综述 - 专知VIP

会员服务 ·

26

强化学习 · 多智能体系统 · 多智能体协作 · 开放环境机器学习 · 开放环境多智能体协作 ·

开放环境下的协作多智能体强化学习进展综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

**摘要 **多智能体强化学习 (Multi-agent Reinforcement Learning, MARL) 近年来获得广泛关注并在不同领域取得进展. 其中, 协作多智能体强化学习专注于训练智能体团队以协同完成单智能体难以应对的任务目标, 在路径规划, 无人驾驶, 主动电压控制和动态算法配置等场景展现出巨大的应用潜力. 如何提升系统协作效能是协作多智能体强化学习领域研究重点之一, 以往的研究工作主要在简单, 静态和封闭的环境设定中展开. 随着人工智能技术落地的驱使, 目前在多智能体协作领域也有部分研究开始对开放环境下的多智能体协作展开研究, 这些工作从多个方面对智能体所处环境中要素可能发生改变这一情况进行探索与研究, 并取得一定进展. 但是当前主流工作仍然缺乏对该方向的综述. 本文从强化学习概念着手, 针对多智能体系统, 协作多智能体强化学习, 典型方法与测试环境进行介绍, 对封闭到开放环境下的协作多智能体强化学习研究工作进行总结, 提炼出多类研究方向并对典型工作进行介绍. 最后, 本文对当前研究的优势与不足进行了总结, 对未来开放环境下协作多智能体强化学习的发展方向与待研究问题进行展望, 以吸引更多研究人士参与这个新兴方向的研究与交流. 关键词强化学习, 多智能体系统, 多智能体协作, 开放环境机器学习, 开放环境多智能体协作

成为VIP会员查看完整内容

32

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

离线强化学习研究综述

离线强化学习研究综述

专知会员服务

35+阅读 · 1月12日

多智能体强化学习控制与决策研究综述

多智能体强化学习控制与决策研究综述

专知会员服务

43+阅读 · 2024年11月23日

基于多智能体强化学习的博弈综述

基于多智能体强化学习的博弈综述

专知会员服务

47+阅读 · 2024年11月23日

基于表征学习的离线强化学习方法研究综述

基于表征学习的离线强化学习方法研究综述

专知会员服务

28+阅读 · 2024年7月2日

元强化学习研究综述

元强化学习研究综述

专知会员服务

37+阅读 · 2024年4月23日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

41+阅读 · 2024年2月8日

安全强化学习综述

安全强化学习综述

专知会员服务

66+阅读 · 2023年8月23日

基于因果建模的强化学习控制: 现状及展望

基于因果建模的强化学习控制: 现状及展望

专知会员服务

78+阅读 · 2023年3月3日

基于通信的多智能体强化学习进展综述

基于通信的多智能体强化学习进展综述

专知会员服务

112+阅读 · 2022年11月12日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

24+阅读 · 2019年5月19日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

478+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

多智能体系统

多智能体协作

开放环境机器学习

开放环境多智能体协作

相关VIP内容

离线强化学习研究综述

离线强化学习研究综述

专知会员服务

35+阅读 · 1月12日

多智能体强化学习控制与决策研究综述

多智能体强化学习控制与决策研究综述

专知会员服务

43+阅读 · 2024年11月23日

基于多智能体强化学习的博弈综述

基于多智能体强化学习的博弈综述

专知会员服务

47+阅读 · 2024年11月23日

基于表征学习的离线强化学习方法研究综述

基于表征学习的离线强化学习方法研究综述

专知会员服务

28+阅读 · 2024年7月2日

元强化学习研究综述

元强化学习研究综述

专知会员服务

37+阅读 · 2024年4月23日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

41+阅读 · 2024年2月8日

安全强化学习综述

安全强化学习综述

专知会员服务

66+阅读 · 2023年8月23日

基于因果建模的强化学习控制: 现状及展望

基于因果建模的强化学习控制: 现状及展望

专知会员服务

78+阅读 · 2023年3月3日

基于通信的多智能体强化学习进展综述

基于通信的多智能体强化学习进展综述

专知会员服务

112+阅读 · 2022年11月12日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

24+阅读 · 2019年5月19日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

相关基金

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

478+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员