强化学习是人工智能领域的一个分支,研究智能体在特定系统中通过试错学习采取行动的方法。其著名案例包括控制真实机器人或在多数人类热门高难度游戏中实现超人类表现。为开展此类研究,学者通常使用标准化“环境”(如机器人仿真或电子游戏)评估学习方法性能。本文涵盖以下内容:

  • PettingZoo:提供标准化API与多智能体强化学习参考环境集的库,已获广泛应用;

  • SuperSuit:提供易用标准化预处理封装器的库,用于对接学习框架;

  • 街机学习环境(Arcade Learning Environment)扩展:该流行工具被强化学习研究者用于Atari 2600游戏交互,本扩展支持多人游戏模式。

基于上述工具,本文还利用多智能体强化学习开发了一种自然科学研究新方法。“涌现行为”指智能体群体的协调行为(如人行道行人、鸟群编队、交通车流或股市交易者),代表诸多科学领域中普遍未解的重要现象。本研究首次提出通过多智能体强化学习(MARL)系统搜索多智能体系统中所有可能良性(“成熟”)涌现行为的数学形式化框架,并构建基于深度强化学习的初级实现,可应用于任意环境。实验表明,在12个多智能体系统中,该方法可发现超百种涌现行为,其中多数为环境设计者此前未知。此类方法有望解答各类开放科学问题,例如:“该系统可能存在哪些行为?”、“何种系统条件促成此类涌现行为?”或“如何调整系统以抑制特定涌现行为?”

成为VIP会员查看完整内容
13

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《多智能体强化学习中机制设计的优化》103页
专知会员服务
24+阅读 · 5月3日
《多智能体强化学习策略优化算法设计》226页
专知会员服务
60+阅读 · 2024年6月9日
《模拟环境中的沉浸式演练(IRISE)》154页
专知会员服务
37+阅读 · 2024年5月15日
《基于信念的决策建模计算框架》141页
专知会员服务
64+阅读 · 2024年4月27日
【KDD2020】图神经网络:基础与应用,322页ppt
多模态深度学习综述,18页pdf
专知
50+阅读 · 2020年3月29日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
A Survey of Large Language Models
Arxiv
463+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员