强化学习(RL)在人工智能(AI)领域取得了一些最令人瞩目的进展。强化学习从深度神经网络的出现中获益匪浅,深度神经网络使学习代理能够在日益复杂的环境中逼近最优行为。特别是,竞争性 RL 的研究表明,在对抗环境中竞争的多个智能体可以同时学习,以发现它们的最优决策策略。

近年来,竞争性 RL 算法已被用于训练各种游戏和优化问题的高性能人工智能。了解训练这些人工智能模型的基本算法对于利用这些工具应对现实世界的挑战至关重要。网络安全领域正在考虑将竞争性 RL 的新兴研究成果应用于现实世界。

为了利用 RL 开发自动化网络行动(ACO) 工具,可以使用各种环境模拟网络安全事件。其中许多 ACO 环境都是在过去三年中开源的。这些新环境促进了探索人工智能在网络安全方面潜力的研究。这些环境中的现有研究通常是片面的:红方或蓝方智能体接受训练,针对具有固定策略的静态对手优化决策。

通过只针对一个对手或一组静态对手进行训练,学习型人工智能在面对场景中其他所有可能的对手时都无法保持高性能。竞争性 RL 可用来发现对抗环境中任何潜在对手的最佳决策策略。然而,在这些新兴的 ACO 模拟中还没有尝试过。本论文的目的是使用竞争性 RL 训练智能体,使其在模拟 ACO 环境中接近博弈论中的最优策略。

图 4:虚构游戏过程中使用的系统概览,包括actor-critic框架和对手采样。切换代理和对手,为对手的策略库训练新策略。

成为VIP会员查看完整内容
1

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
多智能体自主系统《群体自主系统的实时路径规划》248页
《可解释深度学习:指南》2022亚马逊等68页论文
专知会员服务
59+阅读 · 2022年10月31日
《元强化学习》最新,70页ppt
专知会员服务
77+阅读 · 2022年9月16日
深度强化学习理论最新进展,113页ppt
专知会员服务
74+阅读 · 2022年5月20日
【Jon Paul Janet】机器学习化学应用,153页ppt
专知会员服务
46+阅读 · 2021年12月5日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
【KDD2020】图神经网络:基础与应用,322页ppt
关于强化学习(附代码,练习和解答)
深度学习
36+阅读 · 2018年1月30日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
161+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
421+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
151+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员