你玩《2048》能拿多少分？AI的最高分纪录：401912

会员服务 ·

你玩《2048》能拿多少分？AI的最高分纪录：401912

2020 年 6 月 25 日 THU数据派

来源：量子位

本文约 751字 ，建议阅读 3分钟 。

本文介绍如何用AI玩《2048》。

如果让AI来玩《2048》这样的游戏，那会是怎样一种画面？

现在，有人用强化学习方法实践了起来。

于是，插上DQN的翅膀，AI从零起步，自己琢磨出了《2048》的玩法：

一起手，是不是就有内味了？

这操作，条理清晰到令人感到舒适。“1000，no；1024，yes”的强迫症们不禁纷纷点赞，给这只AI贡献了800+ reddit热度。

用DQN玩《2048》

调教出这只会玩《2048》的AI的，是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。

首先，他采用OpenAI Gym构建了自定义强化学习环境。

其中包括两种2048棋盘表示方式：

二进制——使用二次幂矩阵表示棋盘中的每一块区域
非二进制——原始数字矩阵

模型包含两种类型的神经网络：CNN和MLP（多层感知机）。

据Felipe介绍，与MLP相比，以CNN作为特征提取器的智能体表现得更好。

训完之后，老哥测试了一下，在1000把游戏中，AI有100次达到了2048。

玩《2048》的AI们

目前，这只用DQN训练出的AI玩到2048就打住了。

不过，巴西老哥抛砖，又吸引了不少来献玉的盆友。

比如，同样采用强化学习方法，将时序差分学习和最大期望搜索相结合的2048控制器。

在10步/秒的策略下，它最高能凑出32768。

而在追求高分的路上，有一位来自日本的选手表现亮眼。

依靠7个卷积层的深度卷积网络，这只在《2048》这个游戏中最高拿到了401912分。

正如一位网友所说：这正是一个足够有趣，又不太复杂的强化学习案例。

如果你是刚刚开始学习强化学习，也不妨拿这个小项目练练手~

参考链接

《2048》相关开源项目：
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/

相关论文：
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085

——END——

登录查看更多

相关内容

DQN

关注 0

一图搞定ML！2020版机器学习技术路线图，35页ppt

专知会员服务

94+阅读 · 2020年7月28日

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

28+阅读 · 2020年7月6日

【MIT-Google】反思小样本图像分类:一个好的嵌入是你所需要的全部?

专知会员服务

36+阅读 · 2020年3月28日

30篇「CVPR2020」高赞论文抢先看！看计算机视觉2020在研究什么？

专知会员服务

50+阅读 · 2020年2月28日

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

XLNet团队：只要公平对比，BERT毫无还手之力

机器之心

6+阅读 · 2019年7月23日

ICML 2019收录774篇论文：谷歌153篇，清华北大26篇

量子位

5+阅读 · 2019年5月12日

斯坦福新模型刷新纪录：自然语言理解 GLUE 排行榜最高分！

新智元

4+阅读 · 2019年3月23日

揭秘|AI在斯坦福阅读测试中胜过人类，但TA真的看懂了吗

机器人大讲堂

3+阅读 · 2018年1月25日

AI都干过什么让人细思极恐的事？

全球创新论坛

4+阅读 · 2017年9月15日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Weight Poisoning Attacks on Pre-trained Models

Arxiv

5+阅读 · 2020年4月14日

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Fine-tuned Language Models for Text Classification

Arxiv

5+阅读 · 2018年1月18日

VIP会员