我们介绍了一套多智能体系统决策算法(集中式、分布式和混合式),并提出了用于自主赛博安全的因子值(FV)蒙特卡洛树搜索(MCTS)混合成本最大加算法。我们提出的算法包括两个步骤。第一步,每个智能体使用 MCTS 寻找其最佳的单个行动,同时考虑成本。每个智能体向团队提交其最有前途的行动。第二步,使用混合成本最大加法算法进行联合行动选择。这种混合成本 Max-Plus 算法改进了已知的集中式和分布式无成本 Max-Plus 算法,将行动成本纳入了智能体的互动中。Max-Plus 算法使用协调图框架,利用智能体之间的依赖关系将全局报酬函数分解为局部项的总和。我们提出的 FV-MCTS-Hybrid-Cost-Max-Plus 算法是在线的、随时的、分布式的,并可根据智能体数量及其互动情况进行扩展。我们的贡献可与使用 MCTS 和 Max-Plus 利用智能体互动的局部性进行规划和行动的最新方法和算法相媲美。