深度强化学习系列之--OpenAI-Baselines的使用方法

2018 年 6 月 11 日 深度强化学习实验室



本文同步发在楼主博客:

https://blog.csdn.net/gsww404/article/details/80627892

更多强化学习更新将与博客互相同步推送,敬请关注:


OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用

OpenAI、DeepMind,伯克利三个可以说是强化学习的推动者,其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子,以A2C算法为例子(具体a2c算法原理后续讲解):

首先就是安装gym环境,具体直接参考OpenAI的github: https://github.com/openai/gym 
本文使用了Atari游戏,那么在gym中需要安装,不然有的游戏可能不会默认安装:

pip install -e '.[atari]'

这是原话:The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:

import gym
env = gym.make('SpaceInvaders-v0')
env.reset()
env.render()

下一步就是clone baselines的仓库了:

git clone https://github.com/openai/baselines.git

然后进入目录进行运行:

目录如下:
total 48drwxrwxr-x  6 jqw  jqw  4096 Jun  8 16:50 .drwxrwxr-x  3 jqw  jqw  4096 Jun  7 11:07 ..drwxrwxr-x 15 jqw  jqw  4096 Jun  8 19:42 baselines
drwxr-xr-x  2 root root 4096 Jun  8 16:50 baselines.egg-infodrwxrwxr-x  2 jqw  jqw  4096 Jun  7 11:08 data-rw-rw-r--  1 jqw  jqw   504 Jun  7 11:08 Dockerfile
drwxrwxr-x  8 jqw  jqw  4096 Jun  7 11:08 .git-rw-rw-r--  1 jqw  jqw   285 Jun  7 11:08 .gitignore-rw-rw-r--  1 jqw  jqw  1087 Jun  7 11:08 LICENSE-rw-rw-r--  1 jqw  jqw  3417 Jun  7 11:08 README.md-rw-rw-r--  1 jqw  jqw   957 Jun  7 11:08 setup.py-rw-rw-r--  1 jqw  jqw   224 Jun  7 11:08 .travis.yml
python3 -m baselines.a2c.run_atari

就可以了,其他的算法同样的道理。

注意:此处使用给的是python3, 
那么对应需要在python3下安装numpy, matplotlib, tensorflow, 等一系列库,此处省略

注意:如果使用OpenAI的baselines运行Mujoco环境,可能存在一些列问题,下一篇文章将会介绍!敬请期待,欢迎大家互相讨论学习!

参考: 
https://github.com/openai/gym 
https://github.com/openai/baselines


登录查看更多
0

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
最新《智能交通系统的深度强化学习》综述论文,22页pdf
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
116+阅读 · 2019年12月31日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
通过Docker安装谷歌足球游戏环境
CreateAMind
11+阅读 · 2019年7月7日
谷歌足球游戏环境使用介绍
CreateAMind
31+阅读 · 2019年6月27日
快速上手深度强化学习?学会TensorForce就够了
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
【干货】强化学习介绍
专知
11+阅读 · 2018年6月24日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
8+阅读 · 2019年3月21日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
6+阅读 · 2018年6月21日
Arxiv
5+阅读 · 2018年6月12日
Arxiv
8+阅读 · 2018年5月1日
VIP会员
相关VIP内容
最新《智能交通系统的深度强化学习》综述论文,22页pdf
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
116+阅读 · 2019年12月31日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
相关资讯
通过Docker安装谷歌足球游戏环境
CreateAMind
11+阅读 · 2019年7月7日
谷歌足球游戏环境使用介绍
CreateAMind
31+阅读 · 2019年6月27日
快速上手深度强化学习?学会TensorForce就够了
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
【干货】强化学习介绍
专知
11+阅读 · 2018年6月24日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
相关论文
Top
微信扫码咨询专知VIP会员