会员服务 ·

“AI就是统计学”？阿里AI负责人金榕逐条驳诺奖得主萨金特

2018 年 8 月 27 日 量子位

雷刚发自凹非寺
量子位报道 | 公众号 QbitAI

“AI首先是华丽辞藻，其实就是统计学。”

这是2011年诺贝尔经济学奖获得者托马斯·萨金特（Thomas J. Sargent）近期在中国公开演讲时对AI的结论。

于是一石激起千层浪。

AI研究者纷纷坐不住了，其中，阿里AI负责人、阿里巴巴达摩院机器智能技术实验室主任金榕，决定逐条批驳萨金特的观点。

也借机正本清源，表达了对于AI发展现状和未来的看法。

量子位将问答实录编辑如下，最后也附录了萨金特演讲实录，孰是孰非，一辩便明。

△ 阿里AI业务负责人金榕

金榕驳萨金特

问：萨金特说，“人工智能其实就是统计学，只不过用了一个很华丽的辞藻，其实就是统计学。好多的公式都非常老，但是所有的人工智能利用的都是统计学来解决问题。”

金榕：这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系，因而认为AI也是这样。即使是他提到的动态规划（dynamic programming），也不属于统计学范畴。

除了统计，AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外，有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学，或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。

在这里我们首先需要定义什么是人工智能背后的核心技术。现在人工智能技术的成功背后，是基于对海量数据的学习，因此大量的大数据处理、优化以及分布式计算基础设施都扮演了非常重要的角色。

此外，AI还涉及到一个关键因素，就是如何实现最优的智能决策（例如AI打游戏）。一些理论和实证研究已经发现，神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。

还有，人工智能在计算机视觉、语音识别等领域取得的突破，还得益于硬件的日趋成熟。类似智能音箱天猫精灵、Echo的成功不仅来自于成熟的语音识别算法，也源于麦克风阵列等硬件设备变得越来越可靠。

那如何比较准确的表述统计学和AI的关系呢？应该说，统计学是人工智能若干重要基础之一，但远不是全部。

就像我上文提到的除了统计学，AI的核心能力还来自于数学（博弈论、数值分析、逻辑学等）、运筹学（优化）、计算机科技（分布式计算、并行计算、CPU、NPU）、神经科学，甚至心理学。

问：AlphaGo为代表的这一波AI浪潮，跟统计学之间有直接关系吗？

金榕：AlphaGo使用了蒙特卡洛树搜索、神经网络、增强学习等方法，因为算法规模大，所以采用了分布式计算来实现。棋力更强的AlphaGo Zero没有使用人类数据，而是从自我博弈中学习。

所以这更说明AI远比统计学来得广泛。所以推动这一波AI浪潮的正是神经网络的迅速发展，以及能够让大量数据发挥作用的算法和算力。

问：托马斯·萨金特也谈到了交叉学科研究推动的科技进步，您是否认同？如何评价这种观点？在这波深度学习为推动力的AI浪潮中，哪些学科的交叉起到了推动作用？

金榕：这一观点我很认同，这也是很多学者的共识。就像我上面提到的，AI不是独自成长起来的。1956年的达特茅斯会议(Dartmouth Conference)被学术界公认为是人工智能的起源。

今天有人说现在是人工智能的春天，其实这都源于我之前提到的一系列技术的发展与进步。特别是我刚刚提到的硬件，诸如麦克风阵列技术的成熟对语音识别的发展起到了重要作用。还有超强的算力，不论是GPU或者是云计算，都给我们带来了强大的计算能力和灵活度。

我们在自然语言对话机器人的开发中，还会应用到许多心理学知识。所以说人工智能的繁荣是诸多学科交叉相互影响，共同促进的结果。

问：下一波大的AI技术跃迁，您觉得会有赖于哪些领域/学科的交叉研究成果？

金榕：我认为首先可能来自于AI芯片、量子计算这些全新的计算基础设施对算力的巨大提升上。

此外还有神经科学的一些重要突破，可能将揭示大脑中神经元如何处理信息与做出决策的，这对人工智能的发展也有重要意义。

问：人工智能的概念提出已经60多年了，许多算法和模型在几十年前就曾提出了，但在过去的发展中，碍于计算力和数据的局限，此前的发展并没有像如今这样迅速，这是不是从侧面印证人工智能也算是统计学的一种呢？

金榕：计算力和数据的增长是人工智能发展的必要条件。AI的发展还要感谢Hinton，LeCun, Bengio等研究者的长期坚持。当然统计学也在发展，但由于深度学习的迅速发展，它们反而变得没有以前那么重要了。

除了统计学，对现在人工智能发展起到举足轻重作用的，神经网络的一些研究工作，也是在50年前进行的，但它被广泛应用是从2010年后开始的。

在2010年前，许多上一代机器学习成果的确是基于统计学的，他们被归类于统计机器学习。但技术是持续进步的，近几年推动人工智能进入发展快车道的深度学习技术，并不能归因于统计学。

问：在您能看来，应该如何定义人工智能，如果要跟大众普及的话，应该传递一个什么样的概念？

金榕：我认为智能化的目的，不是让机器像人一样。上一个世纪，在工业时代，我们基本上把人变得越来越像机器，而未来我们真正应该走的道路是，让机器更像机器，人更像人。我们发明了机器，不一定要机器按照人的思考。

机器要有自己的学习方式、思考的方式、解决问题的方式，所以我们提出“机器智能”。机器智能不应该是，让机器人复制人类的智能，而是发展出自己独特的智能。我们应该让机器做人类做不到的东西，让机器去发展自己智能的力量、尊重机器、敬畏机器。所以在阿里我们是以“机器智能”为目标。

举几个例子，诸如人工智能客服，它能7*24小时的工作，对海量用户的接待能力远超人类。人工智能应用于城市大脑，通过智能决策和管理能大幅缩短交通拥堵时间，甚至提高救护车到达现场的时间。

AI在工业领域的应用，诸如将计算机视觉应用于产品质检，已经为许多制造企业节省了数十亿元。这些都是AI比人类更擅长的领域。而在艺术、文学等创造性工作上，人工智能可能永远无法替代人类。

问：还有一种观点是认为算法、计算力和数据是人工智能技术能否成功的三个关键，你是否也这样认为？阿里AI在这三方面现状如何？

金榕：历史上人工智能经历了多次黄金时期。到了今天，我们迎来了新的一波热潮。

那么这次的人工智能热潮有哪些不一样的地方呢。就是由于我们在算法、计算力、数据上都有了重要突破。

首先人类首次拥有了超强的计算能力，不论是GPU还是云计算。给我们带来了强大的计算能力和灵活度。这点阿里具有很大的优势。阿里云在中国拥有最大的云计算服务，同时我们也在积极探索量子计算。

其次，也是很重要的一点，就是大量的数据的产生。海量的数据使AI模型的大规模训练成为可能。阿里巴巴积累了海量的数据与应用场景，这些数据将成为阿里在人工智能领域快速突破的基础。

最后，就是算法领域的突破。深度学习等新技术已经在各个领域得到广泛应用，比如计算机视觉、语音识别、自然语言处等，多点开花。阿里也在算法领域做了很多探索。诸如在语音识别领域，阿里推出了新一代语音识别模型——DFSMN，不仅被谷歌等国外巨头在论文中重点引用，更将全球语音识别准确率纪录提升至96.04%（基于世界最大的免费语音识别数据库LibriSpeech）。

而在机器翻译领域，在此前结束的WMT2018国际机器翻译大赛上，达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构，在所有提交的5项比赛中，全数获得冠军。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译。短短一年时间，我们已经在20多个各领域的国际人工智能大赛上获得冠军。

附：托马斯·萨金特的演讲全文

托马斯·萨金特：1943年生，1968年获哈佛哲学博士，先后执教于明尼苏达大学、芝加哥大学和哈佛大学，2003年起任教纽约大学至今。

自70年代初以来，萨金特一直是理性预期学派的领袖人物，为新古典宏观经济学体系的建立和发展作出了杰出贡献。

2011年，萨金特与普林斯顿大学西姆斯教授一起获得诺贝尔经济学家，得奖理由是：“对宏观经济中因果的实证研究”。

以下演讲是萨金特在厚益控股&《财经》世界科技创新论坛上的演讲全文：

首先我对刚才几位嘉宾讲的话非常感兴趣，我想先谈一谈我的感受，然后再讲讲我的部分。

第一，能不能扮演上帝。作为科学家，很多领域的科学家，我们都需要用统计数据说话。其实在这个时候我们已经在扮演上帝的角色了。

什么意思？有好多应用科学像工程学、物理学、经济学都是应用科学，我们会建立一些模型模拟世界运营，我们的理论也是一样，都是由一系列的等式所构成，有一些随机组成部件。

我们的目的是希望解释我们所观察到的世界上的现象，而我们关键的工具是使用模型，然后放到电脑里模拟。把模拟后的数据拿来，利用数学方法，去微调它的参数，希望尽量接近于现实。

在这个过程中，我们扮演上帝的角色。所以写参数、模拟过程中是在假装，我们是在假装是上帝产生了这些数据。我们尽量想接近这个准确度。我们想接近或者模拟上帝的做法。

这个说起来容易做起来非常难，两百年、三百年前人们认为这是个好主意，但是当年的人不知道怎么操作。为什么？因为比如说你写下一个粒子的模型没有办法运算，算不出来。

但是到了二十世纪尤其是二战结束以后，我们出现了一些技术的巨将，包括诺尔曼，来自于奥地利的一个移民。我的岳父泰勒是研究核弹的，他们发明了蒙特卡洛模型，都是50多岁的时候发明的。

但是三、四年以后统计学家来了，搞清楚了可以做统计分析。所以这时候来了一场革命，影响了各行各业的科学家的研究工作，这就是技术创新带来的好处。其实这个过程中我们都在扮演上帝的角色。

我怎么讲到这儿来了呢？人工智能首先是一些很华丽的辞藻。人工智能其实就是统计学，只不过用了一个很华丽的辞藻，其实就是统计学。

好多的公式都非常老，但是我们说所有的人工智能利用的都是统计学来解决问题。有一些新发展，过去二三十年，今天我们统计学的完成质量更高，首先电脑运算速度更快，有新的算法，好多是源于物理学发展，还有统计力学等等，这是过去3到4年从物理学拿来，加速了我们做系列统计学方面的进步。

过去写下来公式，但是没有办法求解，过去你放计算机，但是能力太差，做不了。后来有了AlphaGo，就是一个动态编程，太大了。两三年前的解决之道就是特别大、特别快的计算机，利用一块一块的算法去运算。我觉得亚当斯密百分之百正确，多少年前说应该有专业分工，这是正确的。

今天有很多工具，如果统计学家一点也不懂物理学，很多人类科技进步就不能变成现实。所以我想作为企业家大家也应该做通才，我们应该去考虑来自不同技术的融合或者是相互促进，这就是为什么有了阿尔法GO的成功。

还有一两点，是刚才听了前面发言人的一些感受。到底什么是金融？金融的含义是什么？问一个高中生什么是金融，他觉得是太华丽的一个辞藻。

什么是金融？金融就是有人存钱有人不存钱，有人花的多挣的少，有人想投资，人是不一样的。什么是储蓄？什么是金融？有一些人就是来做中介，存钱的和需要花钱的人做中介，这个业务就是金融。

这个业务包含以下几方面。首先很容易受到欺诈侵害。第二很容易受到不信任的伤害。如果我攒了钱，把钱交给别人帮我打理，我交给的人是我信任的人，他没有不还钱的动机。他为什么还钱给我。金融体系要验证，我把钱借给你之后会不会还我，这就是金融的关键。如何让别人相信你？金融该是信任和验证相关的活动。在这些方面是有技术发展的，就是验证和信任的工具。

是谁作为主体，是国家做还是谁做？你以自己的生活为例，你和你的家人为例，家人之间也有很多的信任和验证。

比如，阿里巴巴或者亚马逊是“国中国”，因为他们的工作是创造交易平台，人们可以参与买方卖方在他们的交易平台上活动，无论是阿里巴巴还是亚马逊都是发挥警察作用，既管理买方也管理卖方，相当于电子警察，他们开发技术，改良交易平台的信任和验证。

像20到25年前你们的工作。就是前沿的工作，当时就在讲这样的问题的理论，这个理论的技术不断进步。

最后我还想一点，有新的领域的出现，我应该意识到算法机制设计。这个涉及了几个领域。

首先，它讲的是如何运转一个国家或者是运转一个公司像阿里巴巴，或者运转一个拍卖，如何保证人们付款。它结合了什么？结合了计算机科学、博弈论、计算、数学运算，也就是说，上过这门课的人了解了好多东西。他要了解各种各样的学科，所以说专家和通才一起开创新的领域，这些都是值得大家追踪的新的领域。

— 完 —

加入社群

量子位AI社群19群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

金榕

关注 1

阿里巴巴的杰出工程师，目前领导着阿里巴巴（前iDST）的机器智能技术部门。在加入阿里巴巴之前，他是密歇根州立大学计算机与科学工程系2003年至2014年的教员。他的研究重点是统计机器学习及其在信息检索中的应用。他发表了200多篇技术论文，主要发表在顶级会议和著名期刊上。他是模式分析和机器智能（TPAMI）IEEE事务和数据知识发现ACM事务的副主编。金博士拥有卡内基梅隆大学计算机科学博士学位。他在2006年获得了NSF职业奖，并在2012年获得了科尔特的最佳论文奖。

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

人机对抗智能技术

专知会员服务

214+阅读 · 2020年5月3日

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

李宏毅《机器学习2020版》正式开放上线：带你进行ML打怪升级！

专知会员服务

111+阅读 · 2020年3月7日