GTA 5真香！哦不，我在用深度学习做自动驾驶

会员服务 ·

GTA 5真香！哦不，我在用深度学习做自动驾驶

2020 年 4 月 17 日 机器之心

选自 GitHub

项目作者：Iker García

机器之心报道

参与：Racoon X

用深度学习当「外挂」，本文将教你如何用 PyTorch 在GTA 5 中训练自动驾驶模型。

最新一代的侠盗猎车手 GTA 5 是这样一款游戏，它内含一个故事驱动的高度自由化世界，以至于游戏推出之后，很多人在通关之后（或者一点剧情没打）会尝试很多非常规的玩法。调整游戏中的物理参数、当一个遵纪守法的「好人」，甚至在游戏里学习侧方位停车帮助考驾照……

对于 AI 开发者来说，GTA 5 有一个庞大的虚拟世界，我们在里面可以开车。所以为什么不能用来训练自动驾驶呢？在新冠疫情期间，我们打游戏的时间不断增加，进而产生了大胆的想法。

项目简介

这是一个使用深层神经网络并运用监督学习实现在 Grand Theft Auto V 中自动驾驶的开源项目。项目使用 PyTorch 编写，并使用了 Nvidia 的 Apex 扩展库，支持混合精度训练与推断，最多大约有两倍的速度提升。训练后模型在驾驶时的策略是模仿人玩 GTA 时的操作，并不会去遵守游戏里的交通规则。例如：地板油在街道上穿行，并躲避其他车辆与行人。当在游戏中设置好目标点后，训练好的模型能够自主地驾驶到对应目标点。

项目地址：https://github.com/ikergarcia1996/Self-Driving-Car-in-Video-Games

项目使用人工标记的数据来训练深层神经网络，即首先记录下游戏中的画面已经人玩游戏时的键盘操作，之后使用该数据集来训练神经网络模型。

这里需要指出的是，本项目只是用 GTA V 作为自动驾驶的例子，理论上其可用于任意一款驾驶的电子游戏中。下图为使用训练后模型进行自动驾驶的效果展示。

这技术，比玩家都稳？

整体框架

此前大多数尝试在电子游戏中实现自动驾驶的模型均包含有深层卷积神经网络（通常是 Inception 或 Resnet）。这些模型以单一图像作为输入。当你看到如下这样一张图像时你会作出什么样的反应呢？

你可能会想到，最好的选择是刹车来避让图中蓝色和灰色车辆。但是，如果这两辆车都停下来让你先过马路怎么办呢？假如你现在实际上是在倒车呢？你当前的车速以及其他车辆的速度是否允许你穿过马路而不会发生碰撞？单一的图像无法为自动驾驶车辆提供足够的信息。我们需要更多的信息，这就是为什么本项目使用一系列图像作为输入的原因。间隔 0.1 秒捕捉 5 张连续的图像，这样的方式为模型提供了更多关于自身、其他车辆与环境的信息。

T.E.D.D. 1104 由一个深层卷积神经网络（Resnet）之后连接一个循环神经网络（LSTM）组成。CNN 用以上 5 张连续的图片作为输入，并为其产生对应的向量表征。之后这些表征将会输送到 RNN 中，RNN 会为整个序列输入产生一个独特的向量表征。最后通过一个全连接网络输出以上序列输入在电脑键盘上对应的按键。整体结构如下图所示。

如何使用

这个项目包含了所有用于生成训练数据、进行模型训练以及使用训练好的模型在游戏中自动驾驶的文件。整个项目使用 Python 3 编写。作者仅在 Windows 10 系统下进行了测试，毕竟大多数人都是在 Win 10 操作系统下玩的 PC 游戏，Linux 和 Mac 上的游戏还是比较偏小众一些。

依赖环境

运行本项目需要安装的依赖环境如下：

Pytorch
Torchvision
Nvidia Apex (only for FP16 training)
numpy
cupy (optional but highly recommended especially for training the model, 10x speed up in data preprocessing comparated with numpy)
cv2 (opencv-python)
glob
h5py
json
win32api (PythonWin) - Should be installed by default in newest Python versions (Python 3.7 reccomended)

生成训练数据集

首先将游戏设置为桌面模式，分辨率设置为 1600x900，将游戏窗口移到桌面左上角位置，如下图所示：

运行如下代码并开始玩游戏：

python generate_data.py --save_dir tedd1007\training_data

该程序会自动地捕捉屏幕并生成用于训练的样本。这些文件将会被保存为「training_dataX.npz」。重新运行以上代码时不用担心原数据集被覆盖，程序会自动检测目录中是否已经存在数据集文件。使用 Q + E 停止收集数据。

训练模型

使用如下代码对模型进行训练：

python train.py --train_new 
--train_dir tedd1007\training_data\train 
--dev_dir tedd1007\training_data\dev 
--test_dir tedd1007\training_data\test 
--output_dir tedd1007\models 
--batch_size 10 
--num_epochs 5 
--fp16

其中--fp16 能够让我们使用混合精度训练（需要显卡支持半精度浮点运算，如：RTX 2000、RTX Titan、Titan V、Tesla V100 等），使用了 Nvidia 的 Apex 扩展库：https://github.com/NVIDIA/apex。训练模型需要消耗大量的显存，项目作者把 batch size 设置为 15 在 RTX 2080 上进行训练。

使用如下代码从保存的 checkpoint 中继续训练：

python train.py --continue_training
--train_dir tedd1007\training_data\train 
--dev_dir tedd1007\training_data\dev 
--test_dir tedd1007\training_data\test 
--output_dir tedd1007\models 
--batch_size 10 
--num_epochs 5 
--checkpoint_path tedd1007\checkpoint\epoch1checkpoint.pt

运行模型

训练完成之后，接下来就可以看 AI 是如何「开车」的了。使用如下命令运行模型：

python run_TEDD1104.py --model_dir D:\GTAV-AI\models --show_current_control --fp16

假如读者的 GPU 有 tensor core 的话（如 RTX 2000、RTX Titan、Titan V、Tesla V100 等），推荐使用--fp16，能够将推理速度大约提升 2 倍并只消耗一半的显存。

GTA 5 里的载具手感和极品飞车等游戏有所不同，对于手残的我们来说撞墙在所难免。自从学习了人工智能，一切看来变得有了希望。

机器之心 CVPR 2020 线上分享的第一期，我们邀请到北京大学智能科学系陈汉亭（论文一作）为我们分享主题《加法神经网络：在深度学习中我们是否真的需要乘法？》，欢迎读者报名学习。

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

最新《深度学习自动驾驶》技术综述论文，28页pdf

专知会员服务

156+阅读 · 2020年6月14日

Gary Marcus力作：AI的下个十年，向‘强’人工智能迈进的四步战略（附59页论文下载）

专知会员服务

39+阅读 · 2020年2月20日

【2020新书】深度学习视觉系统，Deep Learning for Vision Systems, 396页pdf

专知会员服务

171+阅读 · 2020年2月18日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【CVPR 2019 | tutorial】阿波罗，开放式自主驾驶平台：Apollo， Open Autonomous Driving Platform

专知会员服务

32+阅读 · 2019年11月28日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

专知会员服务

52+阅读 · 2019年11月1日

深度学习算法与架构回顾

专知会员服务

84+阅读 · 2019年10月20日

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

专知会员服务

107+阅读 · 2019年10月17日

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

使用vae与sac实现简单自动驾驶

CreateAMind

9+阅读 · 2019年6月6日

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

用深度学习玩「英雄联盟」；Facebook 开源物体检测平台 | Github 项目推荐

AI研习社

3+阅读 · 2018年1月27日

2017年深度学习重大研究进展全解读

深度学习世界

3+阅读 · 2017年12月22日

准确率98%的深度学习交通标志识别是如何做到的？

云栖社区

6+阅读 · 2017年9月10日

图像识别 | 道路识别的自动驾驶算法基本原理

沈浩老师

6+阅读 · 2017年5月12日

Low-Resource Response Generation with Template Prior

Arxiv

4+阅读 · 2019年9月26日

Adversarial Objects Against LiDAR-Based Autonomous Driving Systems

Arxiv

7+阅读 · 2019年7月11日

Monocular Plan View Networks for Autonomous Driving

Arxiv

6+阅读 · 2019年5月16日

FastDraw: Addressing the Long Tail of Lane Detection by Adapting a Sequential Prediction Network

Arxiv

6+阅读 · 2019年5月14日

SlowFast Networks for Video Recognition

Arxiv

4+阅读 · 2019年4月18日

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

Neural Approaches to Conversational AI

Arxiv

8+阅读 · 2018年12月13日

ShelfNet for Real-time Semantic Segmentation

Arxiv

7+阅读 · 2018年12月10日

Multi-Head Attention with Disagreement Regularization

Arxiv

9+阅读 · 2018年10月24日

Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation

Arxiv

9+阅读 · 2018年9月17日

VIP会员

GTA 5真香！哦不，我在用深度学习做自动驾驶

相关内容

知识荟萃

更多