美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告 - 专知VIP

会员服务 ·

82

AI与军事 · 自动驾驶 · 任务分配 · 美国空军研究实验室（AFRL） ·

2023 年 3 月 25 日

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本项目的目标是利用智能体间通信基础设施提高多智能体任务分布式协调的效率。在这个项目的第一阶段，我们探索了基于共识捆绑算法(CBBA)的增强，用于预算约束下的分布式任务分配。CBBA技术的局限性在于，所有智能体必须预先知道环境，并且必须清楚地定义具有已知代价和回报的任务。这种技术显然不适合在未知环境下的合作任务，因为智能体间必须一起探索和即兴发挥他们的行动。在本项目的第二阶段，我们研究了在未知环境下，智能体只有部分观测的任务合作技术。本研究以多智能体捕食博弈为平台。目标是让智能体共同定位和捕获猎物。智能体对环境和猎物的逃跑算法没有先验知识。他们相互交流，以获得超出自己局部观测的环境信息。基于对环境的局部理解，智能体选择自己的行动，包括移动到哪里以及是否与其他智能体通信，以最大化团队奖励。应用强化学习来优化智能体的策略，使游戏以最少的步骤完成。

我们第二阶段研究的主要贡献是信念图辅助多智能体系统(BAMS)。信任映射表示智能体在融合传入消息后维护环境的隐藏状态。通过将信念图与强化学习框架集成，并向信念图提供反馈，我们加速了训练并提高了系统可以接收的奖励。在不同复杂程度的环境中，使用捕食者和猎物合作游戏来评估BAMS的性能。与具有消息传递功能的现有多智能体模型相比，BAMS提供了以下优点：

1)训练收敛速度加快68%，使用BAMS模型训练的智能体完成游戏的步数减少了27.5%。

2)性能稳健：应用模式下，智能体的数量不必与训练环境相同。

3)对智能体之间的通信信息进行加密。BAMS中的信息是智能体对环境信念的学习表征的向量。它们不仅包含关于智能体和环境的当前和未来状态的信息。每个数字与智能体或环境的任何物理属性都不对应。除非有经过训练的BAMS模型，否则不可能解码信息。

4)智能体在训练过程中达成默契。从实验结果来看，使用BAMS训练的智能体似乎可以在没有明确通信的情况下理解彼此的意图。

5)解码后的信念图为智能体的决策提供了一个粗略的解释。在BAMS中，信念图解码器与策略网络一起训练。通过将信念图与实际图进行比较，系统接收到额外的反馈通道，从而监督训练过程。在执行过程中，信念图提供了一种解释智能体隐藏状态的方法，可以进一步用于解释智能体的行为。

成为VIP会员查看完整内容

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《高效和公平的自主智能体分布式任务分配算法：基于机器学习的方法》2023最新报告

《高效和公平的自主智能体分布式任务分配算法：基于机器学习的方法》2023最新报告

专知会员服务

92+阅读 · 2023年4月25日

《针对算法战的人工智能操作化》美陆军报告（译文）

《针对算法战的人工智能操作化》美陆军报告（译文）

专知会员服务

142+阅读 · 2023年1月14日

推荐！《信息环境中的作战行动：实现决策优势》美国陆军62页报告

推荐！《信息环境中的作战行动：实现决策优势》美国陆军62页报告

专知会员服务

182+阅读 · 2023年1月5日

《人工智能和人类-智能体编队：大规模战斗的未来》美国陆军52页报告

《人工智能和人类-智能体编队：大规模战斗的未来》美国陆军52页报告

专知会员服务

208+阅读 · 2022年12月27日

【多无人机协同】《非许可通信的分布式分类与协调》美国空军39页技术报告

【多无人机协同】《非许可通信的分布式分类与协调》美国空军39页技术报告

专知会员服务

90+阅读 · 2022年12月5日

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

专知会员服务

121+阅读 · 2022年12月1日

《人与智能体中的双向通信》2022最新103页报告，美陆军

《人与智能体中的双向通信》2022最新103页报告，美陆军

专知会员服务

59+阅读 · 2022年11月30日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

267+阅读 · 2022年10月5日

《计算和学习博弈》美国空军、加州理工15页项目总结报告

《计算和学习博弈》美国空军、加州理工15页项目总结报告

专知会员服务

41+阅读 · 2022年10月3日

美国陆军研究实验室《机器学习在美国陆军中的当前和未来应用》64页技术报告

美国陆军研究实验室《机器学习在美国陆军中的当前和未来应用》64页技术报告

专知会员服务

77+阅读 · 2022年7月26日

综述 | 分布式GNN训练算法和系统，35页pdf

综述 | 分布式GNN训练算法和系统，35页pdf

图与推荐

5+阅读 · 2022年11月2日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

64+阅读 · 2022年11月2日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知

5+阅读 · 2022年10月9日

《远程精确火力：迈向新范式》美国陆军70页技术报告：适应未来多域作战环境的远程精确火力（LRPF）范式转变

《远程精确火力：迈向新范式》美国陆军70页技术报告：适应未来多域作战环境的远程精确火力（LRPF）范式转变

专知

36+阅读 · 2022年10月7日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

47+阅读 · 2022年10月6日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”项目技术报告，2022年8月

专知

7+阅读 · 2022年9月26日

美国空军研究实验室《概率标签高效的深度生成结构(PLEDGES)》71页重点项目技术报告

美国空军研究实验室《概率标签高效的深度生成结构(PLEDGES)》71页重点项目技术报告

专知

0+阅读 · 2022年7月14日

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

专知

133+阅读 · 2022年5月31日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

超椭圆曲线密码学中的关键算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

基于博弈理论的石化园区厂际热整合研究

国家自然科学基金

1+阅读 · 2013年12月31日

多策略自适应群智能算法及其在大规模生产调度中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间探测任务的机器人群体学习进化与智能协作技术

国家自然科学基金

1+阅读 · 2012年12月31日

弱通信和弱观测条件下欠驱动AUV群体编队地图创建的研究

国家自然科学基金

1+阅读 · 2012年12月31日

拓扑连通性保持与目标任务共同引导的多智能体跨层协同控制

国家自然科学基金

2+阅读 · 2011年12月31日

分布式事件驱动的大规模网络化离散事件动态系统策略优化

国家自然科学基金

0+阅读 · 2011年12月31日

多智能体量子进化模型研究

国家自然科学基金

3+阅读 · 2009年12月31日

分布式集成协作控制在大规模多智能体系统中的设计

国家自然科学基金

8+阅读 · 2009年12月31日

SemiGNN-PPI: Self-Ensembling Multi-Graph Neural Network for Efficient and Generalizable Protein-Protein Interaction Prediction

Arxiv

0+阅读 · 2023年5月15日

KALM: Knowledge-Aware Integration of Local, Document, and Global Contexts for Long Document Understanding

Arxiv

0+阅读 · 2023年5月14日

Switched max-plus linear-dual inequalities: cycle time analysis and applications

Arxiv

0+阅读 · 2023年5月12日

Planning a Community Approach to Diabetes Care in Low- and Middle-Income Countries Using Optimization

Arxiv

0+阅读 · 2023年5月10日

CADGE: Context-Aware Dialogue Generation Enhanced with Graph-Structured Knowledge Aggregation

Arxiv

0+阅读 · 2023年5月10日

Auditing Cross-Cultural Consistency of Human-Annotated Labels for Recommendation Systems

Arxiv

0+阅读 · 2023年5月10日

P4SGD: Programmable Switch Enhanced Model-Parallel Training on Generalized Linear Models on Distributed FPGAs

Arxiv

0+阅读 · 2023年5月10日

Generalized Reductions: Making any Hierarchical Clustering Fair and Balanced with Low Cost

Arxiv

0+阅读 · 2023年5月9日

Foundation Models for Decision Making: Problems, Methods, and Opportunities

Arxiv

36+阅读 · 2023年3月7日

K-AID: Enhancing Pre-trained Language Models with Domain Knowledge for Question Answering

Arxiv

15+阅读 · 2021年9月22日

VIP会员

相关主题

美国空军研究实验室（AFRL）

相关VIP内容

《高效和公平的自主智能体分布式任务分配算法：基于机器学习的方法》2023最新报告

《高效和公平的自主智能体分布式任务分配算法：基于机器学习的方法》2023最新报告

专知会员服务

92+阅读 · 2023年4月25日

《针对算法战的人工智能操作化》美陆军报告（译文）

《针对算法战的人工智能操作化》美陆军报告（译文）

专知会员服务

142+阅读 · 2023年1月14日

推荐！《信息环境中的作战行动：实现决策优势》美国陆军62页报告

推荐！《信息环境中的作战行动：实现决策优势》美国陆军62页报告

专知会员服务

182+阅读 · 2023年1月5日

《人工智能和人类-智能体编队：大规模战斗的未来》美国陆军52页报告

《人工智能和人类-智能体编队：大规模战斗的未来》美国陆军52页报告

专知会员服务

208+阅读 · 2022年12月27日

【多无人机协同】《非许可通信的分布式分类与协调》美国空军39页技术报告

【多无人机协同】《非许可通信的分布式分类与协调》美国空军39页技术报告

专知会员服务

90+阅读 · 2022年12月5日

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

专知会员服务

121+阅读 · 2022年12月1日

《人与智能体中的双向通信》2022最新103页报告，美陆军

《人与智能体中的双向通信》2022最新103页报告，美陆军

专知会员服务

59+阅读 · 2022年11月30日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

267+阅读 · 2022年10月5日

《计算和学习博弈》美国空军、加州理工15页项目总结报告

《计算和学习博弈》美国空军、加州理工15页项目总结报告

专知会员服务

41+阅读 · 2022年10月3日

美国陆军研究实验室《机器学习在美国陆军中的当前和未来应用》64页技术报告

美国陆军研究实验室《机器学习在美国陆军中的当前和未来应用》64页技术报告

专知会员服务

77+阅读 · 2022年7月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国海军陆战队软件定义网络应用案例：分布式防火墙自动化系统》148页

《多体环境下定位导航授时（PNT）系统研究》228页

软件定义无线电（SDR）：商业与军事领域的技术、应用及未来趋势

《攻势防空作战中无人追击者/规避者最优轨迹研究（含动态交战区建模）》95页

相关资讯

综述 | 分布式GNN训练算法和系统，35页pdf

综述 | 分布式GNN训练算法和系统，35页pdf

图与推荐

5+阅读 · 2022年11月2日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

64+阅读 · 2022年11月2日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知

5+阅读 · 2022年10月9日

《远程精确火力：迈向新范式》美国陆军70页技术报告：适应未来多域作战环境的远程精确火力（LRPF）范式转变

《远程精确火力：迈向新范式》美国陆军70页技术报告：适应未来多域作战环境的远程精确火力（LRPF）范式转变

专知

36+阅读 · 2022年10月7日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

47+阅读 · 2022年10月6日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”项目技术报告，2022年8月

专知

7+阅读 · 2022年9月26日

美国空军研究实验室《概率标签高效的深度生成结构(PLEDGES)》71页重点项目技术报告

美国空军研究实验室《概率标签高效的深度生成结构(PLEDGES)》71页重点项目技术报告

专知

0+阅读 · 2022年7月14日

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

中文版《作战云：在军事行动范围内实现多域指挥与控制》美国空军

专知

133+阅读 · 2022年5月31日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关基金

超椭圆曲线密码学中的关键算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

基于博弈理论的石化园区厂际热整合研究

国家自然科学基金

1+阅读 · 2013年12月31日

多策略自适应群智能算法及其在大规模生产调度中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间探测任务的机器人群体学习进化与智能协作技术

国家自然科学基金

1+阅读 · 2012年12月31日

弱通信和弱观测条件下欠驱动AUV群体编队地图创建的研究

国家自然科学基金

1+阅读 · 2012年12月31日

拓扑连通性保持与目标任务共同引导的多智能体跨层协同控制

国家自然科学基金

2+阅读 · 2011年12月31日

分布式事件驱动的大规模网络化离散事件动态系统策略优化

国家自然科学基金

0+阅读 · 2011年12月31日

多智能体量子进化模型研究

国家自然科学基金

3+阅读 · 2009年12月31日

分布式集成协作控制在大规模多智能体系统中的设计

国家自然科学基金

8+阅读 · 2009年12月31日

相关论文

SemiGNN-PPI: Self-Ensembling Multi-Graph Neural Network for Efficient and Generalizable Protein-Protein Interaction Prediction

Arxiv

0+阅读 · 2023年5月15日

KALM: Knowledge-Aware Integration of Local, Document, and Global Contexts for Long Document Understanding

Arxiv

0+阅读 · 2023年5月14日

Switched max-plus linear-dual inequalities: cycle time analysis and applications

Arxiv

0+阅读 · 2023年5月12日

Planning a Community Approach to Diabetes Care in Low- and Middle-Income Countries Using Optimization

Arxiv

0+阅读 · 2023年5月10日

CADGE: Context-Aware Dialogue Generation Enhanced with Graph-Structured Knowledge Aggregation

Arxiv

0+阅读 · 2023年5月10日

Auditing Cross-Cultural Consistency of Human-Annotated Labels for Recommendation Systems

Arxiv

0+阅读 · 2023年5月10日

P4SGD: Programmable Switch Enhanced Model-Parallel Training on Generalized Linear Models on Distributed FPGAs

Arxiv

0+阅读 · 2023年5月10日

Generalized Reductions: Making any Hierarchical Clustering Fair and Balanced with Low Cost

Arxiv

0+阅读 · 2023年5月9日

Foundation Models for Decision Making: Problems, Methods, and Opportunities

Arxiv

36+阅读 · 2023年3月7日

K-AID: Enhancing Pre-trained Language Models with Domain Knowledge for Question Answering

Arxiv

15+阅读 · 2021年9月22日

微信扫码咨询专知VIP会员