一次不成功的深度学习实践 - 微信跳一跳

2018 年 1 月 5 日 深度学习世界

最近微信的跳一跳小程序火了一把,所以前天也更新了微信玩了几盘,最多手动到200左右就不行了。


后来准备用代码写个辅助工具,上Github一查,已经有人做出来了,17年12月29号的项目,不到5天差不多5K的stars,以后还会更多,简直可怕。

https://github.com/wangshub/wechat_jump_game

具体思路都差不多:

  • 用adb调试手机,获取截图;

  • 从截图中识别棋子和目标块的中心点位置;

  • 根据距离计算长按时间,系数和屏幕分辨率相关;

  • 用adb模拟长按,完成跳跃。

唉,多么可惜,错过了一个好项目。

既然别人已经实现了,那就尝试点不一样的,用 深度学习 解决一下。

基本思路

基本流程类似,唯一的区别在于如何获取棋子和目标块的中心位置。

假如长按时间只取决于棋子和目标块的水平位置,那么只需要知道它们水平方向上的坐标即可。

可以看作一个 物体检测 问题,检测出截图中的棋子等物体,这里假设共包含七类物体:

  • 棋子:chess

  • 彩蛋块:包括污水 waste、魔方 magic、商店 shop、音乐盒 music

  • 普通块:包括矩形块 rect、圆形块 circle

模型实现

我手动标注了500张截图,基于ssd_mobilenet_v1_coco模型和TensorFlow物体检测API,训练好的模型跑起来是这么个结果。



可以看到截图中的棋子、魔方、矩形块、圆形块都被检测了出来,每个检测结果包括三部分内容:

  • 物体位置,用矩形标注,对应四元组 ymin、xmin、ymax、xmax;

  • 物体类别,为以上七类中的一种;

  • 检测置信度,越高说明模型对检测结果越有把握。

这不仅仅是简单的规则检测,而是 真正看到了截图中共有哪几个物体,以及每个物体分别是什么

所以接下来,就只需从检测结果中取出棋子的位置,以及最上面一个非棋子物体,即目标块的位置。

有了物体的边界轮廓,取中点即可得到棋子和目标块的水平坐标,这里进行了归一化,即屏幕宽度为1,距离在0至1之间。然后将距离乘以一个系数,作为长按时间并模拟执行即可。

运行结果

看起来很不错,实际跑分结果如何呢?

大概只能达到几百分,问题出在哪?

主要是标注数据太少,模型训练得不够充分,所以检测结果不够准确,有时候检测不出棋子和目标块,而一旦出现这类问题,分数必然就断了。

尝试了以下方法,将一张截图朝不同的方向平移,从而得到九张截图,希望提高检测结果的召回率,但仍然有检测不出来的情况,也许只有靠更多的标注数据才能解决这一问题。

规则检测

模型训练了20W轮,依旧存在检测不出来的情况,郁闷得很,干脆也写一个基于规则的 简单版代码 好了。

花了不到20分钟写完代码,用OpenCV提取边缘,然后检测棋子和目标块的水平中心位置,结果看起来像这样。



事实证明,最后跑出来的分数,比之前的模型要高多了……

说好的深度学习呢?



总结

面对以下情况时,基于人工经验定义规则,比用深度学习训练模型要省力、有效很多:

  • 问题本身比较简单,不需要复杂的抽象;

  • 标注数据比较有限,难以充分训练模型;

  • 错误惩罚很高,对错误不能容忍。即便模型在99%的情况下能完美运行,1%的错误立马让游戏直接结束了,此时反而不如hard code的规则靠谱。

当然,如果大家能一起努力,多弄些标注数据出来,说不定还有些希望。

代码在Github上:https://github.com/Honlan/wechat_jump_tensorflow

不说了,我继续刷分去了,用后面写的不到一百行的代码…

点击下方“阅读原文”了解【大数据实验平台】
↓↓↓
登录查看更多
1

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
56+阅读 · 2019年10月29日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
你有哪些深度学习(rnn、cnn)调参的经验?
七月在线实验室
10+阅读 · 2019年3月27日
实战 | 图像矫正技术
计算机视觉life
5+阅读 · 2019年2月28日
深度学习面试100题(第56-60题)
七月在线实验室
9+阅读 · 2018年7月23日
【286页干货】一天搞懂深度学习
七月在线实验室
9+阅读 · 2018年1月30日
人工智能 | 深度学习机装机流程与体验
沈浩老师
7+阅读 · 2018年1月7日
教你用Python来玩跳一跳
七月在线实验室
6+阅读 · 2018年1月2日
深度学习2017成果展
论智
4+阅读 · 2017年12月26日
爱奇艺个性化推荐排序实践
机器学习研究会
7+阅读 · 2017年11月12日
教程 | 基于遗传算法的拼图游戏解决方案
机器之心
111+阅读 · 2017年11月12日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Learning to See Through Obstructions
Arxiv
7+阅读 · 2020年4月2日
Arxiv
5+阅读 · 2019年10月31日
Arxiv
5+阅读 · 2018年5月28日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年3月14日
VIP会员
相关VIP内容
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
基于小样本学习的图像分类技术综述
专知会员服务
148+阅读 · 2020年5月6日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
56+阅读 · 2019年10月29日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
相关资讯
你有哪些深度学习(rnn、cnn)调参的经验?
七月在线实验室
10+阅读 · 2019年3月27日
实战 | 图像矫正技术
计算机视觉life
5+阅读 · 2019年2月28日
深度学习面试100题(第56-60题)
七月在线实验室
9+阅读 · 2018年7月23日
【286页干货】一天搞懂深度学习
七月在线实验室
9+阅读 · 2018年1月30日
人工智能 | 深度学习机装机流程与体验
沈浩老师
7+阅读 · 2018年1月7日
教你用Python来玩跳一跳
七月在线实验室
6+阅读 · 2018年1月2日
深度学习2017成果展
论智
4+阅读 · 2017年12月26日
爱奇艺个性化推荐排序实践
机器学习研究会
7+阅读 · 2017年11月12日
教程 | 基于遗传算法的拼图游戏解决方案
机器之心
111+阅读 · 2017年11月12日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Top
微信扫码咨询专知VIP会员