DeepMind发布《星际争霸 II》深度学习环境 - 专知

会员服务 ·

0

DeepMind发布《星际争霸 II》深度学习环境

2017 年 9 月 22 日 人工智能学家

来源：AI 研习社

概要：上个月，DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE（《星际争霸II 》学习环境）。

StarCraft II: A New Challenge for Reinforcement Learning

星际争霸 II:增强学习的新挑战

上个月，DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE（《星际争霸II 》学习环境）。

论文描述《星际争霸II 》行动和奖励规范，并提供一个开源的Python界面，用于与游戏引擎进行通信。暴雪提供游戏输入输出的API，DeepMind又做了层基于Python的封装。

除了主要的游戏地图，他们提供了一套专注于《星际争霸II 》游戏不同元素的迷你游戏。对于主要的游戏地图，还提供了一个伴随专业玩家的游戏重播数据数据集。从该数据训练的神经网络的初始基线结果，预测游戏结果和玩家行为。

文中使用了被称为Blizzard分数的一个中间分数，这个分数包含了一个对当前资源、等级以及单位和建筑的加权和，如果玩家赢得战斗而且管理好资源，这个分数就会单调增加，失败的时候，这个分数就会减少。此外，系统还使用了一系列的特征层为AI编码相关信息，比如地形高度、相机位置、屏幕中单位的血量以及各种其他信息。

最后，提出了应用于《星际争霸II 》的规范深强化学习的初始基线结果。DeepMind之后也会发布上百万帧的选手游戏记录，这对模拟环境研究也会有很大的帮助。

观看论文解读大概需要 6 分钟

学霸们还请自行阅读论文以获得更多细节

登录查看更多

9

相关内容

DeepMind

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战

DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战

机器之心

9+阅读 · 2019年8月28日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

13+阅读 · 2019年3月23日

教程 | 如何在Unity环境中用强化学习训练Donkey Car

教程 | 如何在Unity环境中用强化学习训练Donkey Car

论智

27+阅读 · 2018年9月13日

零基础搞懂强化学习？这份视频攻略不算迟

零基础搞懂强化学习？这份视频攻略不算迟

AI研习社

6+阅读 · 2018年4月25日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

专知

9+阅读 · 2018年1月17日

DeepMind 推出 AlphaGo 围棋教学工具，围棋学习新纪元来了？（附中英文版下载地址）

DeepMind 推出 AlphaGo 围棋教学工具，围棋学习新纪元来了？（附中英文版下载地址）

EGONetworks

6+阅读 · 2017年12月19日

教程 | 深度强化学习入门：用TensorFlow构建你的第一个游戏AI

教程 | 深度强化学习入门：用TensorFlow构建你的第一个游戏AI

机器之心

6+阅读 · 2017年11月16日

资源 | 英特尔Nervana发布强化学习库Coach：支持多种价值与策略优化算法

资源 | 英特尔Nervana发布强化学习库Coach：支持多种价值与策略优化算法

机器之心

4+阅读 · 2017年10月22日

【强化学习】Keras+OpenAI强化学习实践：行为-评判模型

【强化学习】Keras+OpenAI强化学习实践：行为-评判模型

产业智能官

4+阅读 · 2017年8月17日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

Arxiv

15+阅读 · 2018年5月24日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

Long-Term Visual Object Tracking Benchmark

Arxiv

3+阅读 · 2018年3月22日

A dataset and architecture for visual reasoning with a working memory

Arxiv

3+阅读 · 2018年3月16日

VIP会员

相关主题

机器学习平台

相关VIP内容

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

147+阅读 · 2019年12月25日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

数据驱动死亡：以色列AI战争机器如何锁定目标

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

ICML 2025 | BiAssemble: 双臂机器人几何拼合问题的协同可供性学习

ICML 2025杰出论文出炉：8篇获奖，南大研究者榜上有名

相关资讯

DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战

DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战

机器之心

9+阅读 · 2019年8月28日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

13+阅读 · 2019年3月23日

教程 | 如何在Unity环境中用强化学习训练Donkey Car

教程 | 如何在Unity环境中用强化学习训练Donkey Car

论智

27+阅读 · 2018年9月13日

零基础搞懂强化学习？这份视频攻略不算迟

零基础搞懂强化学习？这份视频攻略不算迟

AI研习社

6+阅读 · 2018年4月25日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

【重磅】DeepMind发布Nature论文: 博弈网络让智能体成为游戏大咖

专知

9+阅读 · 2018年1月17日

DeepMind 推出 AlphaGo 围棋教学工具，围棋学习新纪元来了？（附中英文版下载地址）

DeepMind 推出 AlphaGo 围棋教学工具，围棋学习新纪元来了？（附中英文版下载地址）

EGONetworks

6+阅读 · 2017年12月19日

教程 | 深度强化学习入门：用TensorFlow构建你的第一个游戏AI

教程 | 深度强化学习入门：用TensorFlow构建你的第一个游戏AI

机器之心

6+阅读 · 2017年11月16日

资源 | 英特尔Nervana发布强化学习库Coach：支持多种价值与策略优化算法

资源 | 英特尔Nervana发布强化学习库Coach：支持多种价值与策略优化算法

机器之心

4+阅读 · 2017年10月22日

【强化学习】Keras+OpenAI强化学习实践：行为-评判模型

【强化学习】Keras+OpenAI强化学习实践：行为-评判模型

产业智能官

4+阅读 · 2017年8月17日

相关论文

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Relational recurrent neural networks

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

Arxiv

15+阅读 · 2018年5月24日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking

Arxiv

11+阅读 · 2018年3月23日

Long-Term Visual Object Tracking Benchmark

Arxiv

3+阅读 · 2018年3月22日

A dataset and architecture for visual reasoning with a working memory

Arxiv

3+阅读 · 2018年3月16日

大家都在搜

久别重逢话双塔

生成式人工智能

斯坦福博士论文

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员