Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

2018 年 3 月 6 日 AI研习社 孔令双

Matterport3DSimulator 可以使用视觉信息(RGB-D 图像)开发与真实 3D 环境交互的 AI Agent,它主要应用于深度强化学习的研究以及自然语言处理和机器人技术的结合技术。

请访问官网(https://bringmeaspoon.org/)获取最近的更新和 Demo。

这是早期发布的开发代码,官方可能会做一些重大的改变,尤其是考虑与 ParlAI 和 OpenAI Gym 整合之后。

  特征

  • 数据集由 90 个不同的室内环境组成(包括住宅、办公室、酒店、教堂)

  • 所有的图像都是真实的,不是合成的(提供更多的视觉复杂度)

  • 用于 C++ 和 Python 的 API

  • 可定制的图像分辨率、相机参数等

  • 支持使用 OpenGL 的 GPU 渲染,以及使用 OSMESA 的离屏(off-screen)CPU 渲染。

  参考

Matterport3DSimulator 和 Room-to-Room (R2R)  导航数据集在下述的论文中有详细描述:

https://arxiv.org/abs/1711.07280

如果你要使用模拟器或者数据集,请引用以下论文:

@article{mattersim,
 title={{Vision-and-Language Navigation}: Interpreting visually-grounded navigation instructions in real environments},
 author={Peter Anderson and Qi Wu and Damien Teney and Jake Bruce and Mark Johnson and Niko S{\"u}nderhauf and Ian Reid and Stephen Gould and Anton van den Hengel},
 journal={arXiv preprint arXiv:1711.07280},
 year={2017}
}

  安装

前提

有 C++11 支持的 C++ 编译器是必要的,另外,Matterport3DSimulator 有以下的依赖关系:

  • OpenCV >= 2.4 including 3.x

  • OpenGL

  • OSMesa

  • GLM

  • Numpy

  • pybind11 for Python bindings

  • Doxygen for building documentation

举个例子,在 Ubuntu 上安装依赖关系:

sudo apt-get install libopencv-dev python-opencv freeglut3 freeglut3-dev libglm-dev libjsoncpp-dev doxygen libosmesa6-dev libosmesa6

Clone Repo

Clone Matterport3DSimulator 库:

# Make sure to clone with --recursive
git clone --recursive https://github.com/peteanderson80/Matterport3DSimulator.git
cd Matterport3DSimulator

如果你没有使用 --recursive 标志进行克隆,则需要从顶级目录手动克隆 pybind 子模块:

git submodule update --init --recursive

目录结构:

  • connectivity: Json navigation graphs.

  • webgl_imgs: Contains dataset views rendered with javascript (for test comparisons).

  • sim_imgs: Will contain simulator rendered images after running tests.

  • models: Caffe models for precomputing ResNet image features.

  • img_features: Storage for precomputed image features.

  • data: You create a symlink to the Matterport3D dataset.

  • tasks: Currently just the Room-to-Room (R2R) navigation task.

下载数据集

要使用 Matterport3DSimulator,必须先下载 Matterport3D 数据集(https://niessner.github.io/Matterport/),或者下载预先计算的 ResNet 图像特征并使用离散化的视点。

编译

用 Cmake 来构建 OpenGL

mkdir build && cd build
cmake ..
make
cd ../

用 Cmake 构建 OSMESA

mkdir build && cd build
cmake -DOSMESA_RENDERING=ON ..
make
cd ../

要为doxygen目录中的 C ++ 类构建 html 文档,请运行以下命令并导航到 doxygen / html / index.html:

doxygen

Demo

这些是非常简单的 Demo 演示,旨在说明模拟器如何在 Python 和 C++ 中使用

Python demo:

python src/driver/driver.py

C++ demo:

build/mattersim_main

运行测试

build/tests

如果你没有安装 Matterport3D 数据集,则需要跳过渲染测试:

build/tests exclude:[Rendering]

其他的配置和用法,请参考 Catch 文档:https://github.com/philsquared/Catch

  任务

目前模拟器只支持一项任务:Room-to-Room (R2R)  导航任务

请参阅具体的指导来设置和运行此任务:

https://github.com/peteanderson80/Matterport3DSimulator/blob/master/tasks/R2R/README.md

详细信息请访问 Matterport3DSimulator 官方 Github 页面:

https://github.com/peteanderson80/Matterport3DSimulator。

NLP 工程师入门实践班:基于深度学习的自然语言处理

三大模块,五大应用,手把手快速入门 NLP

海外博士讲师,丰富项目经验

算法 + 实践,搭配典型行业应用

随到随学,专业社群,讲师在线答疑

▼▼▼




新人福利



关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】




Github 项目推荐 | 用 Pytorch 实现的 WaveNet-Vocoder

登录查看更多
9

相关内容

OpenGL(Open Graphics Library)是个定义了一个跨编程语言、跨平台的编程接口的规格,它用于生成二维、三维图像。
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
93+阅读 · 2019年12月23日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架
AI研习社
35+阅读 · 2019年6月10日
(Python)3D人脸处理工具Face3d
AI研习社
7+阅读 · 2019年2月10日
Github 项目推荐 | 开源演绎推理工具 —— therefore
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
VisualData 公布Matterport 3D重建数据集
AR酱
10+阅读 · 2017年10月8日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
11+阅读 · 2018年5月13日
VIP会员
Top
微信扫码咨询专知VIP会员