《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》 - 专知VIP

会员服务 ·

31

AI与军事 · 多智能体强化学习 · 多任务决策 ·

2024 年 8 月 3 日

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文介绍了一种通过整合领域知识和基于注意力的策略机制来增强多智能体强化学习（MARL）的替代方法。方法侧重于将特定领域的专业知识融入学习过程，从而简化协作行为的开发。这种方法旨在通过使智能体专注于复杂任务的重要方面，从而优化学习曲线，降低与 MARL 相关的复杂性和学习开销。在我们的模型中，注意力机制的利用起到了关键作用。它可以有效处理动态上下文数据和智能体之间细微的互动，从而做出更精细的决策。在斯坦福智能系统实验室（SISL）“追逐 ”和 “多粒子环境”（MPE）“简单扩展 ”等标准 MARL 场景中的应用表明，我们的方法既能提高学习效率，又能提高协作行为的有效性。结果表明，我们基于注意力的方法可以在行动层面整合特定领域的知识，是提高 MARL 训练过程效率的可行方法。

成为VIP会员查看完整内容

54

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《解码人工智能的结构性风险动态》

《解码人工智能的结构性风险动态》

专知会员服务

37+阅读 · 2024年7月13日

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

83+阅读 · 2024年5月5日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

76+阅读 · 2024年4月22日

《深度学习：整合领域知识，解读网络决策》

《深度学习：整合领域知识，解读网络决策》

专知会员服务

38+阅读 · 2024年1月9日

《人工智能对战略和业务决策的影响》

《人工智能对战略和业务决策的影响》

专知会员服务

58+阅读 · 2023年12月17日

《通过自适应蜂群智能实现认知物联网系统》

《通过自适应蜂群智能实现认知物联网系统》

专知会员服务

45+阅读 · 2023年10月29日

《应对人工智能系统测试和评估新挑战的最佳实践》

《应对人工智能系统测试和评估新挑战的最佳实践》

专知会员服务

85+阅读 · 2023年8月7日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

《创建一支更智能的陆军：半监督学习在图像分类中的应用》

《创建一支更智能的陆军：半监督学习在图像分类中的应用》

专知会员服务

27+阅读 · 2023年7月12日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

123+阅读 · 2023年7月10日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

23+阅读 · 2022年11月24日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

45+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

33+阅读 · 2022年6月2日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

多智能体强化学习

多任务决策

相关VIP内容

《解码人工智能的结构性风险动态》

《解码人工智能的结构性风险动态》

专知会员服务

37+阅读 · 2024年7月13日

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

83+阅读 · 2024年5月5日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

76+阅读 · 2024年4月22日

《深度学习：整合领域知识，解读网络决策》

《深度学习：整合领域知识，解读网络决策》

专知会员服务

38+阅读 · 2024年1月9日

《人工智能对战略和业务决策的影响》

《人工智能对战略和业务决策的影响》

专知会员服务

58+阅读 · 2023年12月17日

《通过自适应蜂群智能实现认知物联网系统》

《通过自适应蜂群智能实现认知物联网系统》

专知会员服务

45+阅读 · 2023年10月29日

《应对人工智能系统测试和评估新挑战的最佳实践》

《应对人工智能系统测试和评估新挑战的最佳实践》

专知会员服务

85+阅读 · 2023年8月7日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

《创建一支更智能的陆军：半监督学习在图像分类中的应用》

《创建一支更智能的陆军：半监督学习在图像分类中的应用》

专知会员服务

27+阅读 · 2023年7月12日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

123+阅读 · 2023年7月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

23+阅读 · 2022年11月24日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

45+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

33+阅读 · 2022年6月2日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

相关基金

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员