开源星际争霸2多智能体挑战smac

2019 年 2 月 16 日 机器学习算法与Python学习

转自:专知

SMAC是Github上的一个用于在暴雪星际争霸2上进行多智能体协同强化学习(MARL)的环境。SMAC用了暴雪星际争霸2的机器学习API和DeepMing的PySC2为智能体与星际争霸2的交互提供了友好的接口,方便开发者观察和执行行动。


项目地址


https://github.com/oxwhirl/smac


安装SMAC

pip install git+https://github.com/oxwhirl/smac.git

另外,星际争霸2也是要安装的。


示例代码


在下面的代码中,独立的智能体在接收到观察和全局状态后会执行随机策略。

from smac.env import StarCraft2Env
import numpy as np


def main():
   env = StarCraft2Env(map_name="8m")
   env_info = env.get_env_info()

   n_actions = env_info["n_actions"]
   n_agents = env_info["n_agents"]

   n_episodes = 10
   
for e in range(n_episodes):
       env.reset()
       terminated = False
       
episode_reward = 0
       
while not terminated:
           obs = env.get_obs()
           state = env.get_state()

           actions = []
           for agent_id in range(n_agents):
               avail_actions = env.get_avail_agent_actions(agent_id)
               avail_actions_ind = np.nonzero(avail_actions)[0]
               action = np.random.choice(avail_actions_ind)
               actions.append(action)

           reward, terminated, _ = env.step(actions)
           episode_reward += reward

       print("Total reward in episode {} = {}".format(e, episode_reward))

   env.close()


推荐阅读

滴滴官宣裁员,2019年的滴滴你怎么看?

入门 | 一步步教你构建 NLP pipeline

写 Python 时的 5 个坏习惯

158万张图像的鉴黄数据集

抖音爬虫 | 手把手教你下载指定的Douyin视频

资源 | 正则表达式的功法大全

春节假期十大AI事件,看看你都错过了啥

GitHub不为人知的小秘密…让你的工作更高效

登录查看更多
7

相关内容

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
专知会员服务
206+阅读 · 2019年8月30日
PLANET+SAC代码实现和解读
CreateAMind
3+阅读 · 2019年7月24日
DeepMind发布《星际争霸 II》深度学习环境
人工智能学家
8+阅读 · 2017年9月22日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Phrase-Based & Neural Unsupervised Machine Translation
Mobile big data analysis with machine learning
Arxiv
6+阅读 · 2018年8月2日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年4月18日
VIP会员
相关VIP内容
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
专知会员服务
206+阅读 · 2019年8月30日
相关资讯
PLANET+SAC代码实现和解读
CreateAMind
3+阅读 · 2019年7月24日
DeepMind发布《星际争霸 II》深度学习环境
人工智能学家
8+阅读 · 2017年9月22日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员