神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

2020 年 8 月 2 日 机器之心
机器之心报道

编辑:魔王

在游戏里训练「神经网络小怪兽」,学习强化学习!


想了解神经网络,但不知道如何入手?教程太枯燥,论文不好懂?

别怕,这里有款多人在线战术竞技游戏(MOBA),让你在西部牛仔的世界中训练自己的神经网络。在这里,所有「智能体」都是类似怪兽的生物,还有武器!

故事的背景是:Derk 博士想要创建一个具备「神经网络」大脑的生物。

这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽(Derkling)并训练,与其他玩家进行 battle。

而这些小怪兽其实是货真价实的 AI:循环神经网络(RNN)。它具备 30 个输入、12 个输出、32 个记忆插槽(memory slot)、1 个隐藏层和 3000 多个参数,能够「看到」30 多项事物,还能自主决策。


 哇,神经网络这么 cute 吗!是不是很想赋予它超能力?

闯关和 battle 胜利,你就可以升级小怪兽的能力和装备!而这对玩家的挑战在于:选择最好的装备和训练策略。

在这个游戏环境中,有大量策略可供探索,玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单,穿过敌人的队伍直达敌军老巢(雕像),或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。

经过多次迭代,小怪兽终于直达敌军老巢,干掉了敌方的雕像。

小怪兽升级装备了,有枪!

这次不再是与游戏内置的 boss 对战,而是玩家团战。看起来战况很激烈!

Derk 博士使用了哪些技术,帮助小怪兽成长

就整体技术而言,这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家,不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。

此外,这款游戏的技术细节还包括:

  • 小怪兽通过 GA 在并行运行的 128 个「竞技场」(arenas)上进行训练;

  • 所有的模拟和神经网络均在 GPU 上运行,方便快速获取结果(在一台性能不错的计算机上 1 分钟内即可训练 200 代);

  • 智能体可以和游戏内置机器人 PK,也可以互相 battle(自对弈),或者将这两者结合起来;

  • 对于想要深度挖掘小怪兽的「大脑」,充分理解其行为的人而言,这款游戏提供了不错的可视化效果。


目前,这款游戏已发布到 Steam。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/
https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo
https://derkgame.com


机器之心联合旷视科技开设线上公开课:零基础入门旷视天元MegEngine,通过6次课程帮助开发者入门深度学习开发。


8月4日,旷视研究院深度学习框架研究员刘清一将带来等二课,主要介绍数据预处理、模型搭建与调参等相关概念。欢迎大家入群学习。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
0

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
一份简单《图神经网络》教程,28页ppt
专知会员服务
125+阅读 · 2020年8月2日
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
36+阅读 · 2020年7月5日
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
173+阅读 · 2020年5月6日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
77+阅读 · 2020年4月24日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
专知会员服务
210+阅读 · 2019年8月30日
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
直播 | 训练深度脉冲神经网络
AI科技评论
6+阅读 · 2019年1月24日
明早10点大讲堂 | 训练深度脉冲神经网络
AI研习社
11+阅读 · 2019年1月24日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
step-by-step: 夕小瑶版神经网络调参指南(上)
夕小瑶的卖萌屋
6+阅读 · 2018年3月20日
从零学习:生成敌对网络(GAN)入门指南
论智
8+阅读 · 2017年12月23日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
4+阅读 · 2018年9月25日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2018年1月29日
VIP会员
相关VIP内容
一份简单《图神经网络》教程,28页ppt
专知会员服务
125+阅读 · 2020年8月2日
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
36+阅读 · 2020年7月5日
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
173+阅读 · 2020年5月6日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
77+阅读 · 2020年4月24日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
专知会员服务
210+阅读 · 2019年8月30日
相关资讯
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
直播 | 训练深度脉冲神经网络
AI科技评论
6+阅读 · 2019年1月24日
明早10点大讲堂 | 训练深度脉冲神经网络
AI研习社
11+阅读 · 2019年1月24日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
step-by-step: 夕小瑶版神经网络调参指南(上)
夕小瑶的卖萌屋
6+阅读 · 2018年3月20日
从零学习:生成敌对网络(GAN)入门指南
论智
8+阅读 · 2017年12月23日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Top
微信扫码咨询专知VIP会员