Github 项目推荐 | 用于训练和测试文本游戏强化学习 Agent 的工具

2018 年 7 月 16 日 AI研习社

TextWorld 是一个沙盒环境,用于训练和测试基于文本游戏的强化学习 Agent。

Github 链接:

https://github.com/Microsoft/TextWorld

  安装

  • TextWorld 需要 Python 3,目前仅支持 Linux 系统。

  • 安装 TextWorld 最简单的方法是通过 pip。

  • 复制本库后,进入项目的根文件夹(即与setup.py一起)并运行

pip install .

远程安装:

pip install https://github.com/Microsoft/TextWorld/archive/master.zip

**请确保 pip 与您的 Python 3 安装相关联

附加功能

如果需要,可以为TextWorld安装一个或多个额外功能。

pip install .[prompt,vis]

  • [prompt]:启用命令自动完成(仅适用于生成的游戏)。要激活它,请在运行 tw-play 脚本时使用 --hint 选项,然后在提示符处按TAB-TAB。

  • [vis]:启用游戏状态查看器(仅适用于生成的游戏)。要激活它,请在运行 tw-play 脚本时使用 --html-render 选项,并在浏览器中显示游戏的当前状态。

要求

为了使用 TextWorld 生成和播放基于文本的游戏,需要以下系统库:

sudo apt-get -y install uuid-dev libffi-dev build-essential xdot gcc make python3-dev

以及一些可以单独安装的 Python 库

pip install -r requirements.txt

  用法

生成一个游戏

TextWorld 提供了一种通过 tw-make 脚本生成简单的基于文本的游戏的简便方法。 例如:

tw-make custom --world-size 5 --nb-objects 10 --quest-length 5 --output gen_games/

custom 表示我们想要使用以下选项自定义游戏: - world-size 控制世界中的房间数量 - --nb-objects 控制可以与之交互的对象数量(不包括门)和 - quest-length 控制为赢得游戏而键入所需的最少命令数。 完成后,游戏将保存在gen_games /文件夹中。

玩游戏

要玩游戏,可以使用 tw-play 脚本。 例如,播放上一节中生成的游戏的命令是:

tw-play gen_games/simple_game.ulx

*仅支持 Z-machine 的游戏(* .z1至.z8)和 Glulx 的游戏(.ulx)。

文档

https://aka.ms/textworld-docs


新人福利


关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据资料】


强化学习模拟水下稳定性,潜水体 15 分钟学会规则

登录查看更多
5

相关内容

GitHub.com 使用 Git 作为版本控制系统(version control system)提供在线源码托管的服务,同时是个有社交功能的开发者社区。 国外类似服务: Bitbucket.com
Gitlab.com
国内类似服务:
Coding.net
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
28+阅读 · 2020年7月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
290+阅读 · 2020年6月3日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
139+阅读 · 2020年3月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
CALDERA 一款对手自动模拟工具
黑白之道
20+阅读 · 2019年9月17日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
OpenAI「假新闻」生成器GPT-2的最简Python实现
机器之心
4+阅读 · 2019年4月20日
用python和Tesseract实现光学字符识别(OCR)
Python程序员
7+阅读 · 2017年7月18日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
13+阅读 · 2018年1月20日
VIP会员
相关VIP内容
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
28+阅读 · 2020年7月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
290+阅读 · 2020年6月3日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
139+阅读 · 2020年3月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
相关资讯
CALDERA 一款对手自动模拟工具
黑白之道
20+阅读 · 2019年9月17日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
Pupy – 全平台远程控制工具
黑白之道
43+阅读 · 2019年4月26日
OpenAI「假新闻」生成器GPT-2的最简Python实现
机器之心
4+阅读 · 2019年4月20日
用python和Tesseract实现光学字符识别(OCR)
Python程序员
7+阅读 · 2017年7月18日
Top
微信扫码咨询专知VIP会员