机器学习大神迈克尔 · 乔丹:AI革命尚未发生

转载自AI前线 

作者 | 迈克尔·I·乔丹

策划编辑 | Natalie

编译 | Natalie、Debra、Vincent

编辑 | Emily Chen


【导读】 当我们在谈论 AI 时,我们到底在谈什么?人工智能三度崛起,所有的人张口闭口都是 AI,媒体的炒作让人看到未来仿佛已经来到我们的身边。但事实真的如此吗?机器学习宗师级大牛、加州大学伯克利分校计算机科学与统计学教授 Michael I. Jordan 今天在 Medium 上发布了一篇文章,名为《人工智能革命尚未发生》,看似在给这个冉冉升起的行业泼冷水,而实际上,这篇文章带给我们更多的是冷静的思考。


人工智能被称为这个时代的标志,这句话是技术人员、学者、记者和风险投资家一致同意的。如同从技术学术领域跨越到普遍发行的许多术语一样,在使用这些术语的同时存在重大的误解。但这是因为公众不了解科学家所做的事情,实际上科学家经常和公众一样迷惑。我们这个时代在某种程度上从芯片中洞见了智能未来,并用这些成就来娱乐自己、激励自己甚至吓到我们自己。很不幸的事实是:这些都太让我们分心了。


对于我们这个时代,有一种不同的描述。先来听一个故事吧,这是一个有关人类、计算机、数据和生死的故事,这是个真实的故事,并不是一个有关智能的幻想。


14 年前,我的妻子怀孕的时候,我们进行了超声检查。当时病房里有一位遗传学家,她告诉我们,胎儿的心脏周围有一圈白色斑点,“这是唐氏综合症的标志”,她这样说:“现在风险已经高达 1/20。”之后她进一步告诉我们,可以选择用羊膜穿刺的办法确定胎儿是否真的患有唐氏综合症。但是,羊膜穿刺是有风险的,胎儿致死率是三百分之一。作为统计学家,我决定找出这些数字从哪儿来。长话短说,我发现一个统计分析在英国已经进行了十年,这些反映钙积聚的白色斑点确实是唐氏综合症的预测指标。但我也注意到,在我们的检查中使用的成像机器比英国研究中使用的机器每平方英寸多了几百个像素。我回过头来告诉遗传学家,我相信这些白斑可能是假阳性特征——它们实际上是“白噪声”。她说:“啊,这就解释了为什么我们几年前开始看到唐氏综合征诊断的增加,就是从新仪器启用之后开始的。”


我们没有做羊膜穿刺术,几个月后我们有了一个健康的女儿。但是这件事让我感到困扰,特别是在信封计算(back-of-the-envelope calculation)后,我确信全世界当天有成千上万的人得到这种诊断,其中许多人选择了羊膜穿刺术,并且已经造成了一些婴儿不必要的死亡。而这种情况一天又一天发生,不知何时才能得到修复。这个事件显示的问题与我个人的医疗保健无关——它关乎整个医疗系统。它可以测量不同地点和时间的变量和结果,进行统计分析,并在其他地方和时间使用这一结果。这个问题不仅与数据分析本身有关,而且与数据库研究人员所称的数据“来源”有关——广义而言,数据出现在哪里,数据得出了什么推论,以及这些推断与当前情况之间的相关程度如何?或许一个训练有素的人能够在个案的基础上进行所有这些工作,但问题在于如何设计一个大规模医疗系统来做到同样的事,而无需人类进行详细的监督。


我是一名计算机科学家,在我的知识体系中,这样的事几乎是没有先例的,要建立这种超大规模的推理和决策系统,需要将计算机科学与统计数据融合在一起,同时还要考虑人力资源的情况。不仅在医疗领域,在商业、交通和教育等领域,它的需求都很大,而且会比已有的花哨的 AI 系统更加耀眼夺目。


无论我们是否真能在不久的未来理解“智能”,我们确实面临着一个重大挑战,那就是如何将计算机和人类结合在一起从而增强人类生活。虽然有些人认为这一挑战是“人工智能”创造出来的附属品,但其实我们也可以把它看作是一个新的工程分支,虽然看起来比较平凡,但同样令人敬畏。就像过去几十年的土木工程和化学工程一样,这一新学科旨在集中一些关键思想的力量,在保证安全的前提下,为人们带来新的资源和能力。土木工程和化学工程是建立在物理和化学基础上的,而这个新的工程学科将建立在上个世纪赋予“信息”、“算法”、“数据”、“不确定性”、“计算”、“推理”和“优化”等概念的基础之上。此外,由于新学科的大部分重点将放在来自人类和与人类有关的数据上,因此需要从社会科学和人文科学的角度来看待这一学科的发展。


虽然人工智能这个大工程的组成部件已经逐渐显现,但如何把这些部件组合在一起的原则尚未出现,因此这些部件目前只是以临时的方式堆在一起。


而正如人类在土木工程出现之前就已经开始建造房子和桥梁一样,人类已经开始着手建造涉及机器、人和环境的大规模推理和决策系统。但也正如早期的建筑物和桥梁有时会以无法预见的方式倒塌,并带来悲剧性后果一样,我们许多早期的大规模推理和决策系统已经暴露出了严重的概念缺陷。


不幸的是,我们并不善于预测下一个会出现的严重缺陷是什么。我们所缺少的是一门涵盖分析和设计原理的工程学科。


当前公众谈到这些话题的时候总是把什么都说成是“AI”,仿佛这是一个万用通配符,这会导致人们很难推理出这项新兴技术的影响范围和带来的后果。所以,首先让我们开始仔细地考虑一下,“AI”到底指的是什么,不管是过去历史中的“AI”还是最近人们经常谈论的“AI”。


当我们谈论“AI”,我们到底谈的是什么?



  

今天所谓的“人工智能”,特别是大众所谈论的“人工智能”,大部分指的是过去几十年中被称为“机器学习”的东西。机器学习属于算法领域,它融合了统计学、计算机科学和许多其他学科的思想,以设计处理数据、做出预测和帮助决策的算法。真正给现实世界带来影响的是机器学习,而且它所带来的影响并不是最近才有的。事实上,业界在 90 年代初就已经非常清楚地意识到,机器学习未来可能会对工业带来大规模的影响,在本世纪初,亚马逊等极具前瞻性的公司就已经在所有业务中使用机器学习,以解决欺诈检测、供应链预测等关键问题,并构建面向消费者的创新服务,如推荐系统等。在接下来的 20 年中,随着数据和计算资源的迅速增长,很明显,机器学习将能够为任何决策与大规模数据相关联的公司提供新的动力,而不仅是亚马逊。新的商业模式不断涌现。“数据科学”一词开始被用来指代这一现象,反映出机器学习算法专家需要与数据库、分布式系统专家合作,以建立可扩展的、健壮的机器学习系统,同时也反映出推理系统的更大潜力。


在过去几年里,这种想法和技术趋势的融合被重新命名为“AI”。这种重新命名值得仔细研究。


回顾历史,“AI”一词是在上世纪 50 年代末被创造出来的,指的是用软件和硬件实现一个拥有人类智能的实体这一雄心勃勃的愿望。我们将使用“仿人 AI”一词来指代这一愿望,它所强调的是人工智能实体应该是人类的一员,如果不是身体上相似那么至少应该从精神上相似(先不管这意味着什么)。这主要是一项学术研究。虽然诸如运筹学、统计学、模式识别、信息论和控制论等相关的学术领域早已存在,并且常常受到人类智能(和动物智能)的启发,但是这些领域可以说集中在“低级”信号和决策上。比如说,松鼠能够感知它所生活的森林的三维结构,并在树枝间跳跃,这种能力对这些领域是很有启发性的。而“AI”所应该关注的是另外一些不同的东西——人类“推理”和“思考”的“高级认知”能力。然而,60 年过去了,高级推理和思考仍然难以捉摸。现在那些被称为“AI”的发展主要出现在与低级模式识别和运动控制相关的工程领域,以及统计学领域——该学科侧重于在数据中发现模式,并做出有根据的预测、假设检验和决策。


著名的“反向传播”算法在 20 世纪 80 年代初被 David Rumelhart 重新发现,且现在被认为是所谓的“人工智能革命”的核心,但事实上,这一算法最早出现在 20 世纪五六十年代的控制理论领域。它的早期应用之一是优化阿波罗宇宙飞船飞向月球的推力。

虽然自 20 世纪 60 年代以来,我们已经取得了很大的进展,但可以说,这并不是源于对“仿人 AI”的追求。相反,就像阿波罗宇宙飞船一样,这些想法往往隐藏在幕后,是专注于具体工程挑战的研究人员的杰作。虽然公众看不到,但文档检索、文本分类、欺诈检测、推荐系统、个性化搜索、社交网络分析规划和诊断、A/B 测试等领域的研究和系统构建取得了巨大的成功——而这些进步推动了谷歌、Netflix、Facebook 和亚马逊等公司的发展。


人们可以简单地同意将所有这些都称为“AI”,事实上,人们现在似乎就是这么做的。这种随意的命名标签,可能会让优化或统计学领域的研究人员感到意外,他们一觉醒来后发现自己突然就被称为“人工智能研究人员”了。但撇开研究人员的标签不谈,更大的问题是,使用这个单一的、定义不清的首字母缩略词,使人们无法清晰地理解当前正在发生的到底是什么样的技术和商业变革。


在过去的二十年里,在工业界和学术界取得重大进展的应该是“智能增强”(IA),这通常被人们视为对“仿人 AI”的一种补充。在 IA 领域,计算和数据被用来创建增强人类智力和创造力的服务。搜索引擎可以被看作是 IA 的一个例子(它增强了人的记忆和事实知识),自然语言翻译也是如此(它增强了人的交流能力)。基于计算的声音和图像生成是艺术家的调色板和创造力增强器。虽然这类服务可能涉及高级推理和思考,但目前它们并不涉及——它们主要执行各种字符串匹配和数字操作,以捕获人类可以利用的模式。


希望读者能容忍最后一个缩略词,让我们大致设想一下“智能基础设施”(II)学科,即存在一个包含计算、数据和物理实体的网络,使人类环境更加稳定、有趣和安全。这种基础设施正开始出现在运输、医药、商业和金融等领域,并对个人和社会产生巨大影响。类似的问题有时会出现在关于“物联网”的对话中,但“物联网”通常指的仅仅是将“物”放到互联网上的问题,而我所指的“智能基础设施”涵盖的是更大的挑战,包括如何分析这些互相关联的“物”的数据流以发现关于世界的事实,并以比 bit 更高的抽象级别与人类和其他“物”交互。


一个“以人为中心”的新学科将会出现



  

例如,回到我的个人轶事,我们可以想象生活在一个“社会规模化的医疗系统”中,我们在周围的医生和设备之间建立数据流和数据分析流程,从而帮助人类进行诊断和提供护理。这个系统将我们身体里的细胞、DNA、血液检测、周遭环境、群体遗传学和关于药物和治疗的大量科学文献相关信息整合起来,它将不仅关注单个病人和医生,还关注所有人类之间的关系——就像现在的医学检测允许在一组人类(或动物)上进行实验之后被大规模应用一样。借鉴当前银行体系着重解决财务和支付领域挑战的方法,这将有助于保留相关性、出处和可靠性的概念。然而,人们可以预见到这样一个系统将带来的许多问题 ,包括隐私、责任、安全问题等。但这些问题应该被视为挑战,而不是阻碍我们行动的绊脚石。


我们现在遇到了一个关键问题:传统的仿人 AI 是否为解决这些难题的最佳且唯一的方法?事实上,最近大受欢迎的 ML 已经在一些仿人 AI 相关领域得到了成功应用,如计算机视觉、语音识别、游戏机和机器人等。所以,也许我们应该耐心观察这些领域的进一步发展。这里有两点需要说明。首先,尽管报纸上不会宣扬这样一个事实,即仿人 AI 的成功实际上是有限的——我们距离实现仿人 AI 的愿望还很遥远。 不幸的是,仿人 AI 领域一点点的进展和风吹草动都会被媒体关注和夸大,导致过的的兴奋(和恐惧),这在其他工程领域并未出现。


其次,更重要的是,这些领域的成功既不足以解决重要的 IA 和 II 问题,也不是必需的。在效率方面,以自动驾驶车辆为例。为了实现这样的技术,需要解决一系列工程问题,但这些问题可能与人的能力(或人所缺乏的能力)关系不大。整个交通系统(一个 II 系统)可能会更像目前的空中交通管制系统,而不是目前管理松散,虽具有前瞻性,但注意力不集中的人类驾驶员。它将比当前的空中交通管制系统复杂得多,特别是在使用大量数据和自适应统计建模来进行精细的决策时。这些挑战是重中之重,我们也正在为此而努力,因此过于专注于仿人 AI 将会是分心的一件事。


有一些观点认为,仿人 AI 其实包含了 IA 和 II 目标,因为仿人 AI 系统不仅能够解决传统的 AI 问题(例如图灵测试),它还是解决 IA 和 II 问题的最佳选择。这样的论点以前并没有过。土木工程能靠想象创造一个人造木匠或泥瓦匠就能建立得起来的吗?化学工程是否应该让一个人造化学家来创建?更具挑战性的问题是:如果我们的目标是建立一家化学工厂,那么我们是否应该首先创造一个人造化学家,然后才能制定出如何建造化学工厂的计划?


与此类似的一个观点是,人类智力是我们目前所知的唯一智慧,所以第一步,我们应该模仿它。但是人类其实并不擅长所有推理——我们会有失误、偏见和局限。而且,关键是我们并没有进化出现代 II 类系统必须具备的大规模决策的能力,也没有处理 II 类背景下出现的各种不确定性的能力。有人可能会说,人工智能系统不仅会模仿人的智能,而且会“纠正”它,并且还会扩展到任意大范围的问题。但是,这是科幻小说中才会出现的情况,这种推测性的论点虽然在小说创作中很有娱乐性,但它不应该成为我们在面临开始出现的重大 IA 和 II 问题时,拿出的主要策略。


II 系统中的算法和基础设施的问题不难解决,这些并不是仿人 AI 研究的核心课题。II 系统需要管理分布式知识库,这些知识库在不断发生着变化,并且可能在全球范围内并不一致。这些系统必须在做出及时的分布式决策时应考虑到与云端的相互作用,而且必须处理长尾现象,因为可能某个人的数据数量巨大,但大部分个人的数据则很少。另外,它们还必须跨越管理和竞争的界限,解决分享数据的难题。最后,尤其重要的是,II 系统必须将诸如激励和定价等经济概念带入统计和计算基础设施领域,这些基础设施将人与人之间,以及有价物品联系起来。这样的 II 系统不仅可以提供服务,而且在创造市场。诸如音乐、文学和新闻等领域正在翘首以盼这样的市场诞生,让数据分析将生产者和消费者联系起来。而这一切,都必须在不断演变的社会、道德和法律规范的背景下才能进行。


当然,传统的仿人 AI 问题仍然值得关注。然而,目前我们专注于通过收集数据,部署“深度学习”基础设施,以及展示某些模仿狭隘定义的人类技能的系统(很少使用新出现的解释原则)来研究人工智能,却极有可能会偏离解决经典人工智能中重大开放性问题的目标。这些重大问题包括:将意义和推理引入自然语言处理系统的必要性,推断和表示因果关系的必要性,开发计算上易于处理的不确定表示的必要性,以及开发制定并执行长期目标的系统的必要性。 这些都是仿人 AI 的经典目标,但在目前人们对“AI 革命”的喧嚣中,我们很容易忘记这些问题其实还没有得到解决。


IA 的重要性仍将持续,因为在可预见的将来,计算机还是无法与人类在抽象理解现实世界的能力相提并论。我们需要经过深思熟虑的人机互动方案来解决最紧迫的问题。我们希望计算机能够打通人类创造力的任督二脉,而不是取代人类的创造力(无论这可能意味着什么)。


约翰·麦卡锡(John McCarthy,当时是达特茅斯大学的教授,后来在麻省理工学院任职)创造了“人工智能”这个词,显然是为了与诺伯特·维纳(Norbert Wiener)(当时是麻省理工学院的一位老教授)所提出的“控制论”(cybernetics)做出区分。维纳创造的“控制论”是指他自己构想的的智能系统——这一系统与运筹学、统计学、模式识别、信息论和控制理论密切相关。但另一方面,麦卡锡的理论强调了逻辑之间的联系。有趣的是,在麦卡锡术语的旗帜下,维纳的理论却在当今时代占据主导地位。(然而,这种情况当然只是暂时的,人工智能中各派系地位的变化比大多数领域都大得多)。


但我们需要超越麦卡锡和维纳的历史局限。


我们需要认识到,目前关于人工智能的大讨论(专注于狭隘的行业和学术子领域)让我们面临被蒙蔽的风险,难以看到 AI、IA 和 II 全局范围所带来的挑战和机遇。


科幻小说中的幻想和超人类机器的噩梦有一天会成真并不是重点,我们更关心人类理解和塑造技术 AI 的需求,因为它在人们的日常生活中变得更加现实和有影响力。此外,在这种理解和塑造中,我们需要来自各行各业的不同声音,而不仅仅是技术方面的。狭隘地专注于仿人 AI 也会屏蔽掉更广泛的声音。


虽然行业将继续推动发展,但学术界也将继续发挥重要作用,它不仅能提供一些最具创新性的技术思想,而且还可以将计算和统计学科的研究人员与其他领域的研究人员,特别是社会科学、认知科学和人文科学领域的研究者,他们的贡献非常有意义且必要。


另一方面,虽然人文和科学是我们前进的关键,但我们也不应该假装我们正在谈论一个规模和范围空前的工程,我们的社会从古至今一直都在致力于按照规则建造新的人类文明,人工智能也不例外。我们不希望原本旨在帮助我们获得医疗、交通便利和商业机会的系统,到最后被发现并不能很好地工作,它们犯下的错误让人们的生活和幸福受到影响。在这方面,正如我强调的那样,我们至今还没有形成一个聚焦于数据和学习的学科。它们的出现将非常令人兴奋,但目前还未能构成一个工程学科。


而且,我们应该接受这样的事实:我们正目睹一个新的工程分支出现。“工程”(engineering)这个术语通常是指学术或其他领域的狭义定义——冷酷无情,不受影响,并暗含失去人类控制的含义。但是工程学科可以按照我们想要的来创造。

在当今时代,我们有一个真正的机会来设想一些历史上不曾出现的新事物——一个以人为中心的工程学科。


我拒绝给这个新兴的学科命名,但如果仍用首字母缩写词“AI”继续作为术语,我们应意识到它的限制性。反之,我们应该有大局意识,少一点炒作,并认识到未来面临挑战的严峻性。

致谢:在写这篇文章的时候,有很多人对我有很大的帮助,包括 Jeff Bezos,Dave Blei,Rod Brooks,Cathryn Carson,Tom Dietterich,Charles Elkan,Oren Etzioni,David Heckerman,Douglas Hofstadter,Michael Kearns,Tammy Kolda,Ed Lazowska,John Markoff,Esther Rolf,Maja Mataric,Dimitris Papailiopoulos,Ben Recht,Theodoros Rekatsinas,Barbara Rosario 和 Ion Stoica。我想特别感谢 The House 的 Cameron Baradar,他们最先鼓励我写这样一篇文章。


阅读原文:

https://medium.com/@mijordan3/artificial-intelligence-the-revolution-hasnt-happened-yet-5e1d5812e1e7


作者介绍




Michael I. Jordan 是加州大学伯克利分校计算机科学与统计学教授。他在计算、推理、认知和生物科学领域工作了三十多年,曾在加州大学圣迭戈分校就读研究生,后在麻省理工学院和伯克利分校从事教师的工作。他最近担任的职位之一是作为 AI @ The House 的合作伙伴和创始人,这是一家位于伯克利的风险基金和加速器。该基金旨在不仅支持人工智能项目,而且支持 IA 和 II 项目,并且支持在大学环境的背景下研究这些项目,不仅包括工程学科,还包括社会科学、认知科学和人文学科。

据 2016 年《科学》报道,迈克尔·I·乔丹是当今世界最有影响力的计算机科学家。值得一提的是,乔丹的许多学生和博士后包括 Zoubin Ghahramani, Tommi Jaakkola, 吴恩达, Lawrence Saul 和 David Blei 等,也已经成为机器学习领域的重要学者。


本文为专知转载,转载请注明原文出处。

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~


点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员