会员服务 ·

手把手教你训练一个秒杀科比的投篮AI，不服来练 | 附开源代码

2018 年 7 月 24 日 量子位

原作：Abe Haskins
安妮编译整理
量子位出品 | 公众号 QbitAI

在这篇教程中，谷歌工程师Abe Haskins用简洁易懂的语言，教你用Unity3D和TensorFlow生产一只会投篮的AI。

不少人表示，文章中的这些gif图能看一天！教你用AI秒杀NBA球员的校车马上就要发车了，还不快准备上车？

准备阶段

在开始正式训练前，先检查下自己是不是准备好了下面这些工具：

模拟篮球和物理环境Unity
用于训练模型的Node.js和TensorFlow.js
通过ML-agent asset包将模型嵌入Unity的TensorFlowSharp
将TensorFlow.js转换成Unity中可用图的tsjs-converter
将线性回归简单可视化的Google Sheets

所需工具就是这些了，接下来我将手把手教你解释清楚这些工具是怎样应用的。我建议大家先去将开源代码下载下来，方便后续的学习和理解。

代码地址：

https://github.com/abehaskins

明确目标

把目标想得简单些更有利于完成目标，我们可以把这个任务想象成：如果投球手距离篮筐的距离为x，用y程度的力度投球则会进球的简单问题。

这样一想是不是觉得模型都简单了好几度？如果你对如何在Unity中制作更复杂的AI感兴趣，你可以从Unity中查看完整的ML-Agents项目。

ML-Agents项目地址：
https://github.com/Unity-Technologies/ml-agents

篮筐和球

在这个游戏中，我们只需要投篮就好了。首先需要用到的就是Unity，你平时打游戏时看到的那个立方体的logo就是Unity的标志。它是一个游戏引擎，可以为所有平台构建2D和3D游戏。

Unity内置物理世界系统，还包括基础3D建模和脚本运行时（Mono），支持用C#编程。

把球场的大环境拼接起来并不复杂：

没错，图中的红色块就代表玩家。模拟篮筐上设置有隐形触发器，帮助检测小球通过篮筐的具体时间。

触发器使用教程：
https://unity3d.com/cn/learn/tutorials/topics/physics/colliders-triggers

如上图所示，在Unity编辑器中，肉眼可见绿色的隐形触发器。可观察到触发器分为上下两个，这样就能计算出球从篮筐顶部到底部落下消耗的时间。这两个触发器可在/Assets/BallController.cs中的OnTriggerEnter中查看。

上下都有触发器的另一个好处就是，可以据此判断小球的材料，帮助掌握distance和force.y两个核心变量。

投篮

打开/Assets/BallSpawnerController.cs，这是一个负责生产篮球并试图投中篮筐的脚本。你也可以在Shoot()结尾处查看这段代码。

不知道你有没有注意到，Instantiates代码处表示了一个全新的实例，可以在此处设置投篮的力度和距离篮板的距离。

如果你是在/Assets/BallController.cs处打开的，可以查看Start()方法，之后在加入新篮球时会在此用到这段代码。

换句话说，我们创建一个小球，然后给它一定大小的力，设置30秒后球将被自动销毁，来确保我们能处理源源不断新出现的球。

设置好一切后，我们看看自己的这个全明星投篮手是如何投篮的。你可以点击Unity编辑器中的播放按钮，我们会看到……

百发百不中！

为什么会出现这样的情况？答案就在于Assets/BallController.cs代码中float force = 0.2f这一行。这条线让所有球的行动轨迹保持一致，所以出现了一发都没进的惨烈结局。

当然~这不是我们想要的，所以我进行了下一步的与探索。

随机投篮，收集数据

我们可以通过简单将力量变为随机的方式，引入一些随机噪音。

这样就能推测出，能够投中的力度是什么样的。当然这需要一些时间~

如图所示，红色代表没有投中的球，绿色代表已经入篮的球。此时，任何力度的投篮都是我们可以使用的数据点，下面也会谈到这些。

同时，我们需要考虑到，我们希望红色的小球能从任何位置成功投篮，因此我们需要的不仅仅是只从一个地方投篮。在Assets/BallSpawnController.cs位置中，查找这些行并去掉MoveToRandomDistance()即可解决这个问题。

这样，如果我们再次运行，就可以看到红球在每次投篮后都能在球场上热情地跳跃。

随机运动和随机力量的结合创造了一种非常奇妙的东西：数据。如果此时查看Unity中的控制台，你能看到每次投篮时记录的数据。

每次成功投进都会被记录，并且到目前为击球的数量，距离篮筐的距离以及击球所需的力量都可查看。这些数据提升的速度比较慢，我们可以将MoveToRandomDistance()中的参数0.3f（每次投篮的延迟为300毫秒）改成0.05f（延迟50毫秒）。

现在，看看我们参数调试后的结果：

有没有发现，这其实是个不错的训练方式，系统显示成功率为6.4%了。下一步，我们准备将这些数据从Unity中提取出来，并构建一个模型预测所需要的力量。

预测、模型和回归

在用到TensorFlow之前，我们先让Unity环境中的红球完成大约50次命中。

此时如果查看Unity项目的根目录，则应该能够看到一个名为successful_shots.csv的新文件。这是来自Unity的原始转储，我们把这份数据导出来，以便在excel中分析它。

这个.csv文件只有三行，index，distance和force。我在谷歌表格中导入这个文件，创建了带趋势线的散点图，这样就能了解数据的分布情况了。

这些点组合起来可以发现一些规律。y轴为力度、x轴为距离。可以看到，所需的力与投篮距离之间有明显相关性，也有一些例外情况。

是时候让TensorFlow登场了，帮助我们用类似的代码创建更复杂的模型。比如，在一个完整的游戏中，我们可以涵盖进一些新功能。

现在需要创建我们的TensorFlow.js模型了。

在你喜欢的编辑器中打开tsjs/index.js文件，这是一个基于数据训练模型的脚本successful_shots.csv。训练和保存模型的方法如下：

我们从.csv文件中加载数据创建一些列x和y坐标点，让模型学会服从这些数据，之后，保存！

遗憾的是，TensorFlowSharp并不接受Tensorflow.js可以保存成的模型格式，需要我们做些翻译工作才能将模型引入Unity。

一般来说可以将TensorFlow.js Format转化为Keras Format，创建一个检查点；我们也可以将它们与Protobuf Graph Definition合并，创建检查点。

现在，我们看看在Unity里Assets/BallSpawnController.cs下的GetForceFromTensorFlow()中的模型是什么样子的。

比赛日

利用上面已经完成的系统，我们在模型上创建了一写变体，在训练500次时，模拟篮球的运行轨迹是这样的：

正确率提升了10倍！

这还只是训练500次的结果，剩下的交给你了~别忘了回头看看我最后生成的结果，这是多么可爱的游戏啊~

传送门

博客原文地址：

https://medium.com/tensorflow/tf-jam-shooting-hoops-with-machine-learning-7a96e1236c32?linkId=54634097

开源代码在此：

https://github.com/abehaskins

祝你好运~

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

加入社群

量子位AI社群18群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot8入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot8，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

实习生招聘

量子位正在招募活动运营实习生，策划执行AI明星公司CEO、高管等参与的线上/线下活动，有机会与AI行业大牛直接交流。工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节，请在量子位公众号(QbitAI)对话界面，回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

Unity

关注 2

【2020新书】实战R语言4，323页pdf

专知会员服务

102+阅读 · 2020年7月1日

【实用书】学习用Python编写代码进行数据分析，103页pdf

专知会员服务

198+阅读 · 2020年6月29日

《Python机器学习项目实战》，135页pdf带你小白入门机器学习

专知会员服务

174+阅读 · 2020年6月6日

【干货书】数值计算C编程，319页pdf，Numerical C

专知会员服务

71+阅读 · 2020年4月7日

【干货书】流畅Python，766页pdf，中英文版

专知会员服务

226+阅读 · 2020年3月22日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知会员服务

76+阅读 · 2020年1月30日

【书籍推荐】简洁的Python编程（Clean Python），附274页pdf

专知会员服务

183+阅读 · 2020年1月1日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

训练目标检测模型只需要这 6 行代码

AI科技评论

8+阅读 · 2019年8月19日

Python 热图进阶

专知

15+阅读 · 2019年5月4日

谷歌“史上最强GAN”，现在有了PyTorch预训练版，可直接玩耍 | 代码

量子位

16+阅读 · 2019年3月22日

手把手教 | 使用Bert预训练模型文本分类（内附源码）

数据派THU

162+阅读 · 2019年3月12日

手把手教你用Python库Keras做预测（附代码）

数据派THU

14+阅读 · 2018年5月30日

Tensorflow实战系列：手把手教你使用CNN进行图像分类（附完整代码）

专知

22+阅读 · 2018年3月30日

手把手：自然语言处理太难？按这个套路走，就是砍瓜切菜！（附Python代码）

大数据文摘

8+阅读 · 2018年2月28日

手把手：我的深度学习模型训练好了，然后要做啥？

大数据文摘

5+阅读 · 2018年2月7日

手把手教你如何部署深度学习模型

全球人工智能

17+阅读 · 2018年2月5日

手把手教TensorFlow（附代码）

深度学习世界

15+阅读 · 2017年10月17日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Bipedal Walking Robot using Deep Deterministic Policy Gradient

Arxiv

3+阅读 · 2018年7月16日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Learning to Update for Object Tracking

Arxiv

8+阅读 · 2018年6月19日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Robust event-stream pattern tracking based on correlative filter

Arxiv

10+阅读 · 2018年3月17日

Parameter Space Noise for Exploration

Arxiv

3+阅读 · 2018年1月31日

tempoGAN: A Temporally Coherent, Volumetric GAN for Super-resolution Fluid Flow

Arxiv

5+阅读 · 2018年1月29日

Finding ReMO (Related Memory Object): A Simple Neural Architecture for Text based Reasoning

Arxiv

4+阅读 · 2018年1月26日

VIP会员

手把手教你训练一个秒杀科比的投篮AI，不服来练 | 附开源代码

原作：Abe Haskins安妮 编译整理量子位 出品 | 公众号 QbitAI

准备阶段

明确目标

篮筐和球

投篮

随机投篮，收集数据

预测、模型和回归

比赛日

传送门

作者系网易新闻·网易号“各有态度”签约作者

相关内容

原作：Abe Haskins
安妮编译整理
量子位出品 | 公众号 QbitAI