你玩《2048》能拿多少分?AI的最高分纪录:401912

2020 年 6 月 25 日 THU数据派


来源:量子位

本文约 751字 ,建议阅读 3分钟
介绍如何用AI玩《2048》。

如果让AI来玩《2048》这样的游戏,那会是怎样一种画面?

现在,有人用强化学习方法实践了起来。

于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:

一起手,是不是就有内味了?

这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫症们不禁纷纷点赞,给这只AI贡献了800+ reddit热度。

用DQN玩《2048》

调教出这只会玩《2048》的AI的,是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。

首先,他采用OpenAI Gym构建了自定义强化学习环境。

其中包括两种2048棋盘表示方式:

  • 二进制——使用二次幂矩阵表示棋盘中的每一块区域

  • 非二进制——原始数字矩阵

模型包含两种类型的神经网络:CNN和MLP(多层感知机)。

据Felipe介绍,与MLP相比,以CNN作为特征提取器的智能体表现得更好。

训完之后,老哥测试了一下,在1000把游戏中,AI有100次达到了2048。

玩《2048》的AI们

目前,这只用DQN训练出的AI玩到2048就打住了。

不过,巴西老哥抛砖,又吸引了不少来献玉的盆友。

比如,同样采用强化学习方法,将时序差分学习最大期望搜索相结合的2048控制器。

在10步/秒的策略下,它最高能凑出32768

而在追求高分的路上,有一位来自日本的选手表现亮眼。

依靠7个卷积层的深度卷积网络,这只在《2048》这个游戏中最高拿到了401912分。

正如一位网友所说:这正是一个足够有趣,又不太复杂的强化学习案例。

如果你是刚刚开始学习强化学习,也不妨拿这个小项目练练手~

参考链接

《2048》相关开源项目:
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/

相关论文:
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085

——END——


登录查看更多
0

相关内容

【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
128+阅读 · 2020年8月27日
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
182+阅读 · 2020年7月29日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
27+阅读 · 2020年7月6日
【CVPR2020-CMU】无数据模型选择,一种深度框架潜力
专知会员服务
22+阅读 · 2020年4月12日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
XLNet团队:只要公平对比,BERT毫无还手之力
机器之心
6+阅读 · 2019年7月23日
SQN算法效果及代码: Breakout-ram-v4 打砖块
CreateAMind
12+阅读 · 2019年1月21日
大神 一年100篇论文
CreateAMind
15+阅读 · 2018年12月31日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Weight Poisoning Attacks on Pre-trained Models
Arxiv
5+阅读 · 2020年4月14日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
3+阅读 · 2019年3月29日
Arxiv
8+阅读 · 2019年3月21日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2018年1月18日
VIP会员
相关VIP内容
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
128+阅读 · 2020年8月27日
【干货书】管理统计和数据科学原理,678页pdf
专知会员服务
182+阅读 · 2020年7月29日
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
93+阅读 · 2020年7月28日
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
27+阅读 · 2020年7月6日
【CVPR2020-CMU】无数据模型选择,一种深度框架潜力
专知会员服务
22+阅读 · 2020年4月12日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
相关资讯
XLNet团队:只要公平对比,BERT毫无还手之力
机器之心
6+阅读 · 2019年7月23日
SQN算法效果及代码: Breakout-ram-v4 打砖块
CreateAMind
12+阅读 · 2019年1月21日
大神 一年100篇论文
CreateAMind
15+阅读 · 2018年12月31日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
相关论文
Weight Poisoning Attacks on Pre-trained Models
Arxiv
5+阅读 · 2020年4月14日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
3+阅读 · 2019年3月29日
Arxiv
8+阅读 · 2019年3月21日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2018年1月18日
Top
微信扫码咨询专知VIP会员