简单的智慧算法存在吗?一篇机器翻译的文章试图求解

2017 年 9 月 21 日 新智元

1新智元推荐  

来源/作者:周枫


【新智元导读】简单的智慧算法存在吗?物理学家兼畅销书作者、Y Combinator Research的Michael Nielsen就此写了一篇文章。网易有道CEO周枫用有道机译 + 少量人工修正给出了下文。一起来看。



达到人的水平的,简单的人工智能/智慧算法是否有可能存在?这个是一个带有终极性的问题。尤瓦尔·赫拉利的畅销书《未来简史》(Homo Deus)中花了大量笔墨讨论智人的智能的来源,以及『意识』是否真实存在等问题,如果说这些是关于理解智慧的问题,那么『简单的智慧算法是否存在』就是一个关于能否创造智慧的问题。


传统上,很多人都会认为智慧是非常复杂的,没有统一规律的系统。但是近年来以深度学习为代表技术的研究和快速应用,使得人们发现,原来一些简单的方法,可以取得出人意料的好效果。深度学习奠基人之一Yann LeCun的一个演讲标题就是『深度学习不可理喻的有效性』(The Unreasonable Effectiveness of Deep Learning),可以说很好的概括了研究者的惊叹。


但是深度学习和真正意义的智慧还是相去甚远的,总体来说当前的深度学习主要还只是『感知层』的解决方案,而智慧还有常识、推理决策、情感等一系列更复杂的问题。所以这些成果,仅仅说明感知层的『智慧』,是存在简单的算法的(深度学习是统一和简单的东西),那么其它问题如何?这些进展,反而让『简单的智慧算法是否存在』这个问题变得更加有意思。


近期刚好读到AI知名作者Michael Nielsen关于这个问题的文章,个人觉得很精彩,下面是翻译稿(还是有道机译 + 少量人工修正)。文章比较长,花15分钟阅读下,说不定会改变你的三观。 其中关于天文学,以及从基因角度来分析智慧的复杂度的角度,都很有意思。




简单的智慧算法存在吗?

Michael Nielsen


大家对神经网络感兴趣的一个原因是希望有一天它们能超越基本的模式识别问题。也许它们,或者其他基于数字计算机的方法,最终将被用来制造思维机器——与人类智能匹敌或超越人类智慧的机器?这个概念远远超过目前人们会做的事情,但推测起来很有趣。


人们一直在争论,电脑是否有可能达到人类的智慧水平。我不打算回答这个问题。尽管存在争议,但我相信,智慧电脑是可能的——尽管它可能是极其复杂的,也许远远超过目前的技术——总有一天,目前的反对者将会有一天会像活力主义者一样(周枫注:活力主义者Vitalists相信生命中存在某些将活体区别于其它物体的非物质,当然后来证明这样的观点是站不住脚的)。


相反,我在这里探讨的问题是,是否有一套简单的原则可以用来解释智慧?更具体地说,存在有一个简单的智慧算法吗?


一个真正简单的智慧算法的存在是一个大胆的想法。或许这听起来过于乐观了。许多人有一种强烈的直觉,认为智慧有相当大的不可约的复杂性。他们对人类的惊人的多样性和灵活性印象深刻,他们认为一个简单的智慧算法是不可能的。尽管有这种直觉,我认为仓促作出判断是不明智的。科学的历史中充满了这样的例子:一种现象最初显得极其复杂,但后来却被一些简单而强大的想法所解释。


例如,想想早期的天文学。自古以来,人们就知道天空中有许多物体:太阳、月亮、行星、彗星和恒星。这些天体的行为非常不同——例如,恒星在天空中以一种庄严的、有规律的方式移动,而彗星则像是不知从哪儿冒出来的,划过天空,然后消失。在16世纪,只有愚蠢的乐观主义者才会想到,所有这些物体的运动都可以用一套简单的原理来解释。但在17世纪,牛顿提出了他的万有引力理论,不仅解释了所有这些运动,而且还解释了地球上的现象,例如潮汐和地表抛物的行为。16世纪的愚蠢的乐观主义者现在回想起来就像一个悲观主义者,要求的太少。


当然,科学包含了更多这样的例子。考虑到组成我们的世界的无数化学物质,都被门捷列夫的周期表非常漂亮地解释,而周期表本身又可以用一些简单的量子力学规则解释。或者是关于生物世界中存在如此多的复杂性和多样性的谜题,其起源是自然选择进化的原理。这些和许多其他的例子表明,仅仅基于我们的大脑——目前最好的智慧例子——所做的事情似乎非常复杂,就排除智慧的简单解释,是不明智的。


反过来说,尽管有这些乐观的例子,但逻辑上也有可能,智慧只能由大量的根本不同的机制来解释。我们的大脑中的这些机制,可能是在我们物种进化史上的许多不同选择压力下进化而来的。如果这个观点是正确的,那么智慧就包含了相当大的不可约的复杂性,没有一个简单的智慧算法是可能的。


哪一种观点是正确的?


为了深入了解这个问题,我们来问一个与之密切相关的问题,那就是人类大脑如何工作,是否有一个简单的解释。特别是,让我们来看看一些量化大脑复杂性的方法。我们的第一个方法是用连接组学(Connectomics)的角度来观察大脑。这都是关于基础的神经连接:大脑中有多少神经元,有多少胶质细胞,以及神经元之间有多少连接。你可能已经听说过这些数字——大脑包含了1000亿个神经元,1000亿个神经胶质细胞,以及100万亿个神经元之间的连接。这些数字是惊人的。他们也令人生畏。如果我们需要了解所有这些联系的细节(更不用说神经元和神经胶质细胞)才能了解大脑是如何运作的,那么我们肯定不会得到一个简单的智慧算法。


还有第二种,更为乐观的观点,从分子生物学角度看大脑。基本的想法是问:需要多少基因信息来描述大脑的架构。为了解决这个问题,我们首先考虑人类和黑猩猩之间的基因差异。你可能听过“人类是98%的黑猩猩”的声音。这种说法有时不太一样——流行的说法中这个数字可能是95或99%。这些不同是因为最初的数据是通过比较人类和黑猩猩的基因组的采样,而不是整个基因组来估计的。然而,在2007年,整个黑猩猩的基因组都被测序了,我们现在知道人类和黑猩猩的DNA在大约1.25亿个DNA碱基对上有差异,而在每个基因组中总共大约有30亿个DNA碱基对。所以说人类是98%的黑猩猩是不对的——更准确地说我们是96%的黑猩猩。


在这1.25亿碱基对中有多少信息?每一对碱基对都可以被标记为四种可能性之一——遗传密码的“字母”、碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶。所以每个碱基对可以用两个二进制位来描述——正好足够的信息来指定四个标签中的一个。因此,1.25亿碱基对相当于2.5亿比特的信息,这就是人类和黑猩猩之间的基因差异!


当然,这2.5亿比特解释了人类和黑猩猩之间的所有基因差异。我们只对与大脑有关的差异感兴趣。不幸的是,没有人知道需要多大比例的基因差异来解释大脑的差异。但让我们假设一下,2.5亿比特的大脑中有一半是大脑差异的原因。总共是1.25亿比特。


1.25亿比特是一个很大的数字,让我们把它翻译成更人性化的用语,来看下这个数字到底有多大。特别是,等效的英语文本的量是多少?实际上,英语文本的信息量约为每字母1个二进制,这听起来很低——毕竟,字母表有26个字母——但在英语文本中有大量的冗余。当然,你可能会说,我们的基因组也是冗余的,所以每碱基对2位是过高估计。但我们会忽略这一点,因为在最坏的情况下,这意味着我们高估了我们大脑的遗传复杂性。通过这些假设,我们发现我们的大脑和黑猩猩大脑的遗传差异相当于大约1.25亿个字母,约2500万个英语单词。这大约是英皇钦定版圣经(King James Bible)的30倍。


这是很多信息。但并不是不可思议的大,而是一个人类可把握的尺度。也许没有一个人能理解这段代码中所写的所有东西,但是一群人可能通过适当的专门化来理解它。虽然信息量很大,但与描述1000亿个神经元、1000亿个神经胶质细胞和100万亿个大脑连接所需的信息相比,这是微不足道的。即使我们使用一个简单粗糙的描述——比方说,10个浮点数来描述每个连接——那将需要大约70千万亿位。这意味着基因描述比人类大脑的全连接体要少5亿倍。


我们从中学到的是,我们的基因组不可能包含对所有神经连接的详细描述。更确切地说,它必然仅仅指定了大脑的基本架构和基本原理。但这种架构和这些原则似乎足以保证我们人类将成长为聪明的人。当然,也有一些潜在风险——成长中的孩子需要一个健康、刺激的环境和良好的营养,以达到他们的智慧潜力。但是如果我们在一个合理的环境下成长,一个健康的人类将拥有非凡的智慧。在某种意义上,我们基因中的信息包含了我们思考的本质。而且,遗传信息中包含的原则似乎有可能被我们集体所理解和掌握。


以上的数字都是粗略估计。有可能,1.25亿比特是一个巨大的高估,有一些更紧凑的核心原则是人类思想的基础。也许这1.25亿字节中的大部分只是对相对次要的细节进行微调。或者我们在计算数字时过于保守。很明显,如果这是真的,那就太好了!就我们目前的目的而言,重点是:大脑的结构是复杂的,但它并不像你基于大脑的连接数量而想象的那样复杂。从分子生物学的角度来看,我们人类应该有一天能够理解大脑架构背后的基本原理。


在以上几段中,我忽略了一个事实,即1.25亿比特只是量化了人类和黑猩猩大脑的基因差异。并不是所有的大脑功能都是由这1.25亿个位带来的。黑猩猩本身就是了不起的思考者。也许智慧的关键在于黑猩猩和人类共有的心智能力(和遗传信息)。如果这是正确的,那么人类的大脑可能只是黑猩猩大脑的一个微小的升级,至少在基本原理的复杂性方面如此。尽管人类对我们的独特能力有着传统的人类沙文主义想法,但这并不是不可想象的:黑猩猩和人类的遗传线在500万年才出现了分支,在进化的时间尺度上这仅仅是一眨眼功夫。然而,在没有更有说服力的论点的情况下,我对传统的人类沙文主义更为认可:我的猜测是,人类思想中最有趣的原理在于那1.25亿比特,而不是我们与黑猩猩共享的基因组。


从分子生物学的角度来看大脑,我们在描述的复杂性上减少了大约9个数量级。虽然令人鼓舞,但它并没有告诉我们是否存在一个真正简单的智能算法。我们能进一步减少复杂性吗?更重要的是,我们能否解决一个简单的智慧算法是否可行的问题?


不幸的是,目前还没有任何强有力的证据能够决定性地解决这个问题。下面,让我来描述一些现有的证据。这是一个非常简短和不完整的概述,旨在传达一些最新工作的味道,而不是全面调查已知的内容。


在2000年4月《自然》(Nature)杂志上发表的一项实验中,有证据表明,可能存在一种简单的智慧算法。Mriganka Sur带领的一组科学家“重新连线”了新生雪貂的大脑。通常,雪貂的眼睛发出的信号被传送到大脑中称为视觉皮层的部分。但对于这些雪貂,科学家们从眼睛里接收信号并将其重定向到听觉皮层,也就是通常用于听力的大脑区域。


为了弄清楚当他们这样做的时候发生了什么,我们需要知道一些关于视觉皮层的事情。视觉皮层包含许多『方向柱』。这些是小块的神经元,每个神经元都能对从特定的方向到来的视觉刺激做出反应。你可以把方向柱想象成微小的方向传感器:当有人从某个特定的方向发出明亮的光时,相应的方向柱就会被激活。如果光被移动,一个不同的方向柱被激活。视觉皮层最重要的高层结构之一就『是方向图』,它绘制了方向柱的布局图。


科学家们发现,当雪貂的视觉信号被重定向到听觉皮层时,听觉皮层发生了变化。方向柱和方向图开始出现在听觉皮层。它比通常在视觉皮层发现的方向图更无序,但明显相似。此外,科学家们对雪貂对视觉刺激的反应进行了一些简单的测试,训练它们在灯光从不同方向闪烁时做出不同的反应。这些测试表明,雪貂仍然可以通过听觉皮层“看到”,至少是以一种基本的方式。


这是一个惊人的结果。这表明,大脑的不同部分如何学习对感官数据的反应是有共同的原则的。这种共同性至少为『存在简单的智慧原则』这种观点提供了一些支持。然而,我们不应该自欺欺人地认为这些实验中雪貂的视力有多好。行为测试只测试了视觉的非常粗略的方面。当然,我们也不能问雪貂是否已经“学会了看”。因此,这些实验并不能证明重新连接后听觉皮层给了雪貂一个高保真的视觉体验。因此,他们只提供有限的证据支持这个观点,即共同的原则构成了大脑的不同部分的学习能力。


有什么证据不支持简单的智慧算法的存在?一些证据来自进化心理学和神经解剖学。自20世纪60年代以来,进化心理学家已经发现了广泛的人类共性——在不同文化和教养中都共有的复杂行为。这些人类共性包括母亲和儿子之间的乱伦禁忌,音乐和舞蹈的使用,以及许多复杂的语言结构,如使用粗口(即禁忌语)、代词,甚至是最基本的动词。与这些结果相辅相成的是,神经解剖学的大量证据表明,许多人的行为是由大脑特定的局部区域控制的,而这些区域似乎在所有人身上都是相似的。综上所述,这些发现表明,许多非常特殊的行为都被『硬编码』在我们大脑的特定部位。


一些人从这些结果中得出结论,对于大脑的这些功能,必须有单独的解释,因此,大脑的功能有不可约的复杂性,而这一复杂性使得为大脑操作的简单解释(或者,智慧的简单算法)成为不可能。例如,著名的人工智能研究人员马文·明斯基(Marvin Minsky)就持有这一观点的。在20世纪70年代和80年代,明斯基开发了他的“心智社会”理论,基于一个观点,即人类的智慧是一个大型社会的结果,由一个个简单(但非常不同)的计算过程组成,明斯基称之为代理(Agent)。在他的书中,明斯基总结了要点:


什么魔法让我们变得聪明?关键是没有什么魔法。智慧的力量源于我们巨大的多样性,而不是来自任何单一的、完美的原则。


在对他的书的评论的回应中,明斯基阐述了“心智社会”的动机,给出了一个类似于上面所述的观点,基于神经解剖学和进化心理学:


我们现在知道,大脑本身由数百个不同的区域和核组成,每一个都有显著不同的架构元素和安排,其中很多都与我们精神活动的不同方面有关。这一现代的大量知识表明,许多传统上被称为“智慧”或“理解”的常识描述的现象实际上涉及到复杂的机制的组合。


当然,明斯基并不是唯一一个持这种观点的人:我只是以他作为支持这样论点的人的例子。我觉得这个论点很有趣,但不相信证据是有说服力的。虽然大脑确实是由大量不同的区域组成,具有功能不同,但并不能因此推出,大脑功能的简单解释是不可能的。也许这些架构上的差异源于共同的基本原理,就像彗星、行星、太阳和星星的运动都是由单一的引力引起的。无论是明斯基还是其他任何人都没有有力地反驳这些基本原则。


我个人的偏见是:有一个简单的智慧算法。我喜欢这个想法的主要原因,在上面(不确定的)论点之上,是它是一个乐观的想法。当涉及到研究时,一种不合理的乐观情绪往往比看似更合理的悲观主义更有成效,因为乐观主义者有勇气出发去尝试新事物。这是通向发现的道路,即使发现的可能不是最初希望的。悲观主义者在某些狭义上可能更“正确”,但会比乐观主义者得到更少的发现。


这种观点与我们通常判断想法的方式形成了鲜明的对比:试图弄清楚他们到底是对还是错。这是处理日常研究琐事的明智策略。但这可能是判断一个重要而大胆的想法的错误方式,这种想法会决定整个研究项目。有时,我们只有微弱的证据来证明这样的想法是否正确。我们可以温顺地拒绝跟进这个想法,把所有的时间都花在细究已有的证据上,试图辨别什么是真实的。或者,我们可以接受没有人知道真想的事实,而去努力发展一个重要的、大胆的想法。此时我们没有成功的保证,但也只是如此,我们的理解才会进步。


尽管如此,以最乐观的形式,我其实不相信我们会找到一个简单的智慧算法。更具体地说,我不相信我们会发现一个非常短的Python(或C或Lisp,或者其他)程序——比方说,1000行代码以内——来实现人工智能。我也不认为我们会找到一个很容易描述的神经网络来实现人工智能。但我还是相信我们值得这样努力,就像我们能找到这样一个程序或网络一样。这是通向洞察的道路,通过追求这条道路,我们可能有一天能够理解足够多的知识,可以写出一个更长的程序,或者建立一个更复杂的网络,它确实能表现出智慧。所以,我们值得假设一个极其简单的智慧算法存在而来探索。


在20世纪80年代,著名数学家和计算机科学家杰克·施瓦茨被邀请参加人工智能支持者和人工智能怀疑论者之间的辩论。辩论变得不守规矩,支持者们对即将出现的神奇事物提出了夸大其词的主张,而怀疑者们则加倍悲观,声称人工智能完全是不可能的。施瓦茨是这场辩论的局外人,当讨论升温时,他保持沉默。在一个间歇期,他被要求说出自己的想法,陈述他对正在讨论的问题的看法。他说:“好吧,做出这些进展的过程,可能会带来100个诺贝尔奖”。在我看来,这是一个完美的回应。人工智能的关键是简单、强大的想法,我们可以而且应该对这些想法进行乐观的搜索。但我们需要很多这样的想法,而且我们还有很长的路要走!

 

(原文为CC-BY-NC授权,作者Michael Nielsen)


长按关注我吧!   在线教育、深度学习、创业、有道...




【号外】新智元正在进行新一轮招聘,飞往智能宇宙的最美飞船,还有N个座位

点击阅读原文可查看职位详情,期待你的加入~

登录查看更多
0

相关内容

深度学习可解释性研究进展
专知会员服务
98+阅读 · 2020年6月26日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
元学习与图神经网络逻辑推导,55页ppt
专知会员服务
128+阅读 · 2020年4月25日
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
深度学习算法与架构回顾
专知会员服务
81+阅读 · 2019年10月20日
神经网络与深度学习,复旦大学邱锡鹏老师
专知会员服务
118+阅读 · 2019年9月24日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
《常用算法之智能计算 (五) 》:模糊计算
数盟
9+阅读 · 2018年12月24日
IBM长文解读人工智能、机器学习和认知计算
人工智能学家
5+阅读 · 2018年8月26日
CCCF专栏:黄铁军| 也谈强人工智能
中国计算机学会
5+阅读 · 2018年2月15日
CCCF:周志华 | 关于强人工智能
AI科技评论
4+阅读 · 2018年1月17日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
CCCF专栏 | 生成式对抗网络的研究进展与展望
中国计算机学会
13+阅读 · 2017年11月17日
科普丨深度学习 vs 概率图模型 vs 逻辑学
北京思腾合力科技有限公司
6+阅读 · 2017年10月21日
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
3+阅读 · 2018年4月9日
Arxiv
8+阅读 · 2018年3月20日
Arxiv
4+阅读 · 2018年3月14日
VIP会员
相关VIP内容
深度学习可解释性研究进展
专知会员服务
98+阅读 · 2020年6月26日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
元学习与图神经网络逻辑推导,55页ppt
专知会员服务
128+阅读 · 2020年4月25日
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
深度学习算法与架构回顾
专知会员服务
81+阅读 · 2019年10月20日
神经网络与深度学习,复旦大学邱锡鹏老师
专知会员服务
118+阅读 · 2019年9月24日
相关资讯
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
《常用算法之智能计算 (五) 》:模糊计算
数盟
9+阅读 · 2018年12月24日
IBM长文解读人工智能、机器学习和认知计算
人工智能学家
5+阅读 · 2018年8月26日
CCCF专栏:黄铁军| 也谈强人工智能
中国计算机学会
5+阅读 · 2018年2月15日
CCCF:周志华 | 关于强人工智能
AI科技评论
4+阅读 · 2018年1月17日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
CCCF专栏 | 生成式对抗网络的研究进展与展望
中国计算机学会
13+阅读 · 2017年11月17日
科普丨深度学习 vs 概率图模型 vs 逻辑学
北京思腾合力科技有限公司
6+阅读 · 2017年10月21日
相关论文
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
3+阅读 · 2018年4月9日
Arxiv
8+阅读 · 2018年3月20日
Arxiv
4+阅读 · 2018年3月14日
Top
微信扫码咨询专知VIP会员