我们介绍了一套多智能体系统决策算法(集中式、分布式和混合式),并提出了用于自主赛博安全的因子值(FV)蒙特卡洛树搜索(MCTS)混合成本最大加算法。我们提出的算法包括两个步骤。第一步,每个智能体使用 MCTS 寻找其最佳的单个行动,同时考虑成本。每个智能体向团队提交其最有前途的行动。第二步,使用混合成本最大加法算法进行联合行动选择。这种混合成本 Max-Plus 算法改进了已知的集中式和分布式无成本 Max-Plus 算法,将行动成本纳入了智能体的互动中。Max-Plus 算法使用协调图框架,利用智能体之间的依赖关系将全局报酬函数分解为局部项的总和。我们提出的 FV-MCTS-Hybrid-Cost-Max-Plus 算法是在线的、随时的、分布式的,并可根据智能体数量及其互动情况进行扩展。我们的贡献可与使用 MCTS 和 Max-Plus 利用智能体互动的局部性进行规划和行动的最新方法和算法相媲美。

成为VIP会员查看完整内容
39

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《谈判游戏》美海军NPS等最新报告
专知会员服务
30+阅读 · 2023年11月13日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
VIP会员
相关VIP内容
《谈判游戏》美海军NPS等最新报告
专知会员服务
30+阅读 · 2023年11月13日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员