点击上方“专知”关注获取更多AI知识!
来源:https://zhuanlan.zhihu.com/p/30750293
AlphaGo厉害的地方在于结合了工程和科研两方面的工作,通过大量计算资源和工程优化将一个方向推向了极致,并且同时借鉴了十年来大家在围棋上及在计算机视觉上的点滴进展,围棋和强化学习方向上像蒙特卡罗树搜索,自对弈(俗称“左右互搏”),随机走子盘面估值,用人工特征加浅层网络进行快速走子,权衡广度和深度搜索,权衡从头探索和先验知识,计算机视觉方向上像卷积神经网络(CNN),残差网络(ResNet),旋转翻折样本增强,等等。这些都不是DeepMind团队率先想出来的,而是过去的经验一点点积累起来得到的。只是过去的点滴进步并没有进入公众的视野,而AlphaGo达成了这最后的一步。
这个成功有几个先决条件,其一是模型和问题相互匹配。对AlphaGo来说, 模型和问题的匹配度非常重要。卷积神经网络和围棋非常匹配,所以仅用四百九十万样本就可以学到超过人类的能力。这种匹配性是人通过各种直觉和实验去找的,而机器的作用在于可以很快实现人的想法,很快试错。若是模型和问题不匹配,那样本再多,用处也不是很大,因为机器学习中“维数灾难”的问题,要凭暴力填满高维空间,实在不是目前任何数目的计算资源所能搞定的。卷积神经网络(CNN)能和围棋如此投缘,还是因为围棋本身的规则比较纯粹,存有某种内在美,而CNN很适应这种美,一旦适应性起来了,计算机所具备的高速计算能力就可以全面发动,即便从零开始,完全不通过人类棋谱左右互搏也可以成功。在路线对了之后,计算机所具备的稳定性,精确性,和超过人类几十亿倍的计算速度叠加起来,就使得AlphaGo能在三天内远远超过人类作为一个整体三千年来走过的路程。
第二个先决条件是要身处一个完全信息透明的理想世界,并且在做了决策之后,对这个世界的规则、变化和发展有绝对正确的认知。围棋每下一子,大家都会非常清楚地知道局面会变成什么样子,输赢也是非常清楚明白的。AlphaGo Zero虽然没有使用人类棋谱,但它已经从人类这里得到了围棋世界的规则,对于过去七步之内双方下了哪些招法也是完全知晓的(历史记录是附在特征输入之中的,见论文附录),这些就让它对局面的推演变得非常容易,在先天上就比人类强过太多。从零开始到超越人类,这个确实是非常厉害的,但仅仅在围棋世界这个规则分明的地方可以做到。
第三个条件就是要有大量的计算资源。发表于《自然》杂志的两篇AlphaGo的文章,都无一例外地强调了对战时所用的资源数,而有意无意地隐去了训练时所用的资源数。后者从文章(及自己做些实验)可以推算,大约在上万台甚至更多 。这还仅仅只是复现结果需要的资源数目。而作为开拓者,能成功的路线百中无一,那综合各种探索试错的耗费,最后使用的资源更加是个天文数字了。没有这样程度的资源,无法完成这样的工作。
AlphaGo满足这三个条件,其它问题就没有那么容易了。智能对话系统是个很典型的例子,有基本语法规则但又有大量打破这个规则的例外,有此时此境下的约定惯例,又有与时俱进的林林总总的变化。一个能与别人对话的智能,既要从过去的含糊的交互中深刻了解现在的基本规则,又要时刻更新自己的知识体系,能够抽象计划出说话的大概方案,还要及时去推测别人的隐藏状态和世界的发展趋势。这些问题目前都没有答案,都是现在人工智能的难点。
所以说AlphaGo在业内的影响力并不像在大众中(尤其是国内)那么大。在人工智能领域,每个方法都有优缺点和局限性,没有一种方法是万能的。让在AlphaGo上做出惊人结果的卷积神经网络,早先在计算机视觉上已获得巨大的成功,但让它去拟合含有大量离散特征的广告数据,大家都知道效果不佳;同样左右互搏对其它游戏也有相当不错的效果,但让它去做优化机器翻译,未必有人工标定的数据好。我想主要的问题在于我们之前把围棋这个千年的文化传承神化了,所以现在才有这样大的反弹;若是现在再把AlphaGo神化,那不免又掉进一模一样的圈子里去了。
国外对于AlphaGo相比之下要理性很多,在各大论坛上也有更多技术上的深入探讨,而不是陷入玄之又玄的空谈。等到大家有这个实力AlphaGo拆解得七零八落,对它的每个部分都有比较清晰的了解的时候,那我相信它的神秘感,和现在这些疑惑和担扰,也就烟消云散。
现实的神经元是由微分方程描述的连续信号处理器,有精细的时序结构,有电生理,离子通道和神经递质受体,有能量供应和免疫系统。碍于测量的局限和生物系统的复杂性,我们现在对于大脑的单个神经元还没有完全了解清楚,更不用说大量神经元组合在一起的系统了。
另一方面,现有的人工智能算法基本上是和脑科学相互独立的。在各类问题上卓有成效的统计学习方法,比如说线性及非线性拟合方法,最近邻,决策树,随机森林,支持向量机,Boosting等,在大脑结构中鲜有对应。即便在深度学习中所谓的神经元,也不过是线性叠加及非线性操作的组合,是现实大脑中神经元的极大简化,简化到脑科学家不承认的程度。
这两门学科之间可以相互启发,像CNN的思路就和大脑中感受野受限的神经元相似,最近Hinton老前辈试着去用大脑中的柱状体思路去改进现有神经网络的性能,等等;也有学者用统计学习及神经网络的方法对大脑中某些神经元的行为进行建模。但是总的来说,并不存在谁统率谁的问题。
我个人的意见是,不管是脑科学也好,人工智能也罢,本质上来说还是如何找到一个算法有效地构建世界模型的问题。大脑经过长久的进化,固然有自然界的鬼斧神工,但也带着许多因为增量进化而带来的累赘,不必顶礼膜拜,奉为智能的唯一模板。人工智能完全可以在数学原理和大数据的基础上独立发展,就像飞鸟和飞机的区别一样,找到自己的规律。
以前教科书上高估了人的能力,把人类特殊化了。其实长远来看,人没有那么特殊,人作为一种智能体,遵从自己的发展规律,在自然进化的基础上,一点点认识自身及完成对自身的改造。而我们被进化赐予的那些优点,缺点和弱点,也会缩写成茫茫历史中的某一页,成为将来叱咤星海的地球文明的小小注脚。
站在业内人士的角度,人工智能还有很多问题没有解决,比如说我们可以模糊地说CNN和围棋很匹配,或者CNN和计算机视觉非常匹配,所以放在一起得到了出乎意料的效果。但究竟什么才算是匹配?什么是“匹配”这个词定量及精确的定义?对于其它问题,什么是最好的模型,需要用什么样的数据?神经网络究竟建模了什么,和我们的认知有什么区别?这些本质问题都还没有答案,而且目前看来,不论是从工具上还是从观念上看,离摸到答案的边都还远得很。
二十世纪初除了上空有两朵乌云之外,物理学的大厦基本建成(当然现在可能乌云更多);与之相比,人工智能则是铅云密布大雪弥漫的漫漫极夜,人们才刚刚隐约看到头顶黑云缝中那么一点点的月光。
我们只是摸黑摸久了,不习惯看到光罢了;其实,太阳还远未升起。
对于大家来说,首先基本肯定的一点是,将来必然是人与机器合作并且逐步融合的世界。在短短十年的时间里,我们都已经离不开电脑和手机。以古人的标准看,现在的一人加一个手机还算不算人呢?个个博学强记,见多识广,还精通各国语言,只能说是文曲星下凡了。以后如果能有更强的记忆,更快的推理,更准的预测,看得更远,听得更清,大家一定会争相使用,并在这之上制出更好的造物。试想,如果有一种装入大脑就可以提高一倍反应速度的芯片,那谁会拒绝去使用呢?装上了之后,还是不是人类了呢?有多少人会去思考这样的哲学问题?而又有多少人会去反抗这样的大潮呢?
所以说,与其害怕,不如融入。人工智能你不做,我不做,总有人做,而做出来之后,就会有极大的竞争优势。现在基于机器学习的广告系统已经是这样了,写好了程序,躺着可以赚钱,而人要做的是如何改进它,这和传统行业需要不停维护才能有稳定利润率相比,已经是高了一个境界了。以后人工智能做得更好了,可以自动改进算法,那又是高了一个境界。而且这并非几百年后才发生的事情,而是在当下就会发生的现实。历史的列车正在加速前进,以前或许还可以小跑跟随,以后只能搭车借力。
最后,我不觉得人需要去恐惧害怕机器,因为机器也需要人。现实世界无比复杂,其中暗含着无法准确预测的未来,牵一发而动全身的复杂联系,庞大到不可想象的行动空间,及千亿亿亿种自洽自足的目标和意义。围棋棋枰上的状态数已远远超过了宇宙中的原子总数,然而它不过是后院的一张茶几,和煦春日下的几粒石子,还有随风飘散的一口香茗。
在现实世界这个无限复杂的客观实在面前,其实机器和人一样渺小,也必然会携手同行。
欢迎转发到你的微信群和朋友圈,分享专业AI知识!
特别提示:
专知,为人工智能从业者提供专业可信的AI知识分发服务;请登录www.zhuanzhi.ai或者点击阅读原文,顶端搜索“人工智能” 主题,直接获取查看获得关于机器学习更多的知识资料,包括链路荟萃动态资讯精华文章等资料,帮助你更好获取机器学习知识!如下图所示。
专知荟萃知识资料全集获取,请查看:
【专知荟萃01】深度学习知识资料大全集(入门/进阶/论文/代码/数据/综述/领域专家等)(附pdf下载)
【专知荟萃02】自然语言处理NLP知识资料大全集(入门/进阶/论文/Toolkit/数据/综述/专家等)(附pdf下载)
【专知荟萃03】知识图谱KG知识资料全集(入门/进阶/论文/代码/数据/综述/专家等)(附pdf下载)
【专知荟萃04】自动问答QA知识资料全集(入门/进阶/论文/代码/数据/综述/专家等)(附pdf下载)
【专知荟萃05】聊天机器人Chatbot知识资料全集(入门/进阶/论文/软件/数据/专家等)(附pdf下载)
【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版
【GAN货】生成对抗网络知识资料全集(论文/代码/教程/视频/文章等)
【干货】Google GAN之父Ian Goodfellow ICCV2017演讲:解读生成对抗网络的原理与应用
【AlphaGoZero核心技术】深度强化学习知识资料全集(论文/代码/教程/视频/文章等)
获取更多关于机器学习以及人工智能知识资料,请访问www.zhuanzhi.ai, 或者点击阅读原文,即可得到!
-END-
欢迎使用专知
专知,一个新的认知方式!目前聚焦在人工智能领域为AI从业者提供专业可信的知识分发服务, 包括主题定制、主题链路、搜索发现等服务,帮你又好又快找到所需知识。
使用方法>>访问www.zhuanzhi.ai, 或点击文章下方“阅读原文”即可访问专知
中国科学院自动化研究所专知团队
@2017 专知
专 · 知
关注我们的公众号,获取最新关于专知以及人工智能的资讯、技术、算法、深度干货等内容。扫一扫下方关注我们的微信公众号。
点击“阅读原文”,使用专知!