较于深度学习，这种全新的算法似乎更佳？

会员服务 ·

较于深度学习，这种全新的算法似乎更佳？

2018 年 8 月 4 日 数盟

基于目前人类在神经网络算法和机器深度学习取得的成就，很容易让人产生计算机科学只包含这两部分的错觉。毕竟神经网络算法在人脸识别、棋类和各类街机游戏竞技中的表现已经开始超越人类了。

因为这些网络算法都是基于人类的思考模式进行的，好像没什么比这个更有潜力了。但事实果真如此吗？

答案是：不完全是。一种全新的算法甚至比深度学习和神经网络有更明显的优势：这种算法是基于创造人类大脑的方式——进化来进行的。

换句话说，人类是在一系列迭代和择优中产生的，由此诞生了眼睛、耳朵、大脑等精密的工具，足以可见进化的力量。

这也就是计算机科学家一直试图掌控这种能力的原因，况且这种所谓的进化算法在自首次被投入企业生产线优化中的30年里已经创造了巨大的奇迹。

然而近几年由于深度学习技术的如日中天，这种算法也只能屈居其后。

如今，在Dennis Wilson和法国图卢兹大学其他同事的共同努力下这种局面似乎有所逆转，他们在2013年的一次标志性任务的完成中证明了进化算法甚至能够与深度学习相匹敌——在Pong、Breakout和Space invader等街机游戏的表现中均完胜人类，直接显示出无限的潜力。

进化算法的工作原理完全不同于神经网络，其以一种看起来反直觉的方式来创建解决特定问题的计算机代码。

之所以这么说是因为传统的代码创建都是考虑到特定目标依照基本原理进行编译的，而进化算法则不同，它始于完全随机生成的代码，且不止有一个版本，而是诸多版本甚至数十万个代码片段组装而成。

每一个代码都会经过测试看是否符合目标要求，当然由于随机组合结果也可能不理想。

但一旦发现某些代码优于其他代码就会在新一代代码中再现这些片段，其中会延展出优质代码的更多副本。

但是下一代代码不能完全是上一代的复制品，必须有所改变，这就涉及切换代码中的两个部分——即点突变，也可能涉及两个代码被各切一半相互交换——就像有性重组一样。

接着在新一代中继续测试，选择优质代码出现在下一代中，以此类推。

通过这种方法，代码就进化了。随着时间的推移，这些代码会变得越来越优异，如果没有偏离正确的方向，那么它们最终会比任何人为设计出的代码都要完美。

计算机科学家也已成功地将进化算法应用在各种问题中，小到制造机器人，大到制造航空仪器，到处都有它的身影。

但就是由于深度学习算法的热潮，使得它失宠了。所以这就出现了一个值得深思的问题：到底进化算法能不能和深度学习匹敌？为了搞清事实，Wilson和他的同事们使用这种方法来进化能控制20世纪80到90年代街机游戏的代码。

这些街机游戏可以在Arcade Learning Environment数据库中进行使用，目前该数据库也越来越多地被用来测试各种算法的学习能力。该数据库中有61款雅达利游戏，其中包括Pong，Breakout和Space invader等。

该种方法的任务是创建一种仅通过观察屏幕显示就能玩像Pong这种游戏的代码，就和正常人打游戏一样。为此，算法必须能认真分析游戏位置，通过最优化移动力争高分。

当然，对任何游戏的控制都是如此。首先对应地要控制八个方向的按钮（上、下、左、右和四个对角线方向），接着要与不同的攻击按钮组合，但不是所有游戏都有18种组合方式，有些只有四种。

为了完成这项研究首先必须创建代码。进化算法需要一个可以连接起来形成计算机代码的指令集，这些指令的范围从简单的指令（如ADD（x + y）/ 2）到更复杂的指令，例如“如果x是标量，则返回1元素x向量”，每个指令即进化算法中的算子或基因。

当然这个指令集中的指令选择非常重要，Wilson和同事们选用的是为笛卡尔遗传规划制定的集合。

该程序从随机创建包含40个指令的代码开始，即该计划的“基因组”，根据基因组在游戏中的测试得分判断其表现能力。后根据基因组的执行情况对其进行突变再造加入下一次测试中。研究团队以这种方法测试了10000个基因组。

测试结果十分耐人寻味：起初基因组在游戏中的表现都很糟糕，随着不断的再生能力直线上升，最后甚至比正常人类的表现更优秀。

尽管大多基因组都在做一些全新的复杂游戏的游戏攻略，但它们有时也会发现一些人类很容易忽略的问题。

例如在玩《功夫大师》时，进化算法发现最有效率的动作是蹲伏拳，因为在蹲伏中是最安全的：既可以抵挡一半的子弹，也能对附近发起攻击，游刃有余。于是该算法会在没有其他动作的情况下重复蹲伏拳。事实也证明这确实是有效的。

Wilson等研究人员均对此发现感到惊讶：“这种策略比正常玩得分更高，但一般人玩游戏只会在特殊情况下才发动蹲伏拳。”

当然这种进化算法在其他游戏中的表现也相当漂亮，甚至赶超了深度学习算法。此外还有一个优点，因为进化算法比较小量，所以很容易探测它是如何工作的；而众所周知，深度学习算法很难搞清楚为什么产生了特定结果，有时候很容易产生法律纠纷。

总之，这项研究不仅有趣，也为计算机科学家提了个醒：进化算法是个强大的替代算法，应用场景很多元化，错过它可能会很可惜。毕竟有些研究人员已经用它来迭代深度学习了，不得不说潜力巨大啊。

原文链接： www.technologyreview.com

识别下图二维码，加“数盟社区”为好友，回复暗号“入群”，加入数盟社区交流群，群内持续有干货分享~~

媒体合作请联系：

邮箱：xiangxiaoqing@stormorai.com

登录查看更多

相关内容

进化算法

关注 3

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

专知会员服务

134+阅读 · 2020年7月10日

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

专知会员服务

20+阅读 · 2020年6月5日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

机器学习速查手册，135页pdf

专知会员服务

343+阅读 · 2020年3月15日

DeepMind科学家Trask《Grokking Deep Learning》图书及代码, 带你无障碍深度学习，高中数学OK

专知会员服务

93+阅读 · 2020年2月29日

Gary Marcus力作：AI的下个十年，向‘强’人工智能迈进的四步战略（附59页论文下载）

专知会员服务

39+阅读 · 2020年2月20日

阿里巴巴达摩院发布「2020十大科技趋势」

专知会员服务

108+阅读 · 2020年1月2日

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

神经网络与深度学习，复旦大学邱锡鹏老师

专知会员服务

121+阅读 · 2019年9月24日

【深度学习】深度学习的问题究竟在哪？

产业智能官

4+阅读 · 2019年8月30日

AI 最大的挑战：也许我们从根上就错了

InfoQ

5+阅读 · 2019年6月14日

我和一个年入的5亿的CEO聊了聊！真正拉开人生差距的，不是能力！

创业财经汇

17+阅读 · 2019年2月23日

【深度强化学习】想轻松复现深度强化学习论文,看这篇经验之谈。深度强化学习+启发人类的决策智能。

产业智能官

8+阅读 · 2019年1月18日

《深度学习革命》作者：GAN令我惊艳，现在的人们对AI操之过急了

全球人工智能

6+阅读 · 2018年10月22日

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

机器之心

5+阅读 · 2018年4月4日

深度学习2017成果展

论智

4+阅读 · 2017年12月26日

分析 | 盘点人工神经网络超过人类的6个领域

网易智能菌

5+阅读 · 2017年12月12日

从零基础成为深度学习高手——Ⅰ

计算机视觉战队

7+阅读 · 2017年12月7日

【强化学习】Keras+OpenAI强化学习实践：行为-评判模型

产业智能官

4+阅读 · 2017年8月17日

Neural Image Captioning

Arxiv

5+阅读 · 2019年7月2日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

11+阅读 · 2019年6月2日

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study

Arxiv

4+阅读 · 2019年5月9日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Improving Online Multiple Object tracking with Deep Metric Learning

Arxiv

7+阅读 · 2018年6月20日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems

Arxiv

7+阅读 · 2018年5月21日

Decoupled Novel Object Captioner

Arxiv

7+阅读 · 2018年4月11日

End-to-End Video Captioning with Multitask Reinforcement Learning

Arxiv

5+阅读 · 2018年3月21日

Interpreting CNN Knowledge via an Explanatory Graph

Arxiv

11+阅读 · 2017年11月22日

VIP会员