AI英雄 | 对话Yoshua Bengio：喧嚣与忽悠之外，关于AI的正解

会员服务 ·

AI英雄 | 对话Yoshua Bengio：喧嚣与忽悠之外，关于AI的正解

2017 年 10 月 30 日 网易智能菌 聚焦AI的

本文系网易新闻-智能工作室出品

聚焦AI，读懂下一个大时代！

网易年度AI人物评选——2017网易AI英雄风云榜，自荐提名进行中！

奖项设置：技术创新人物TOP 10，商业创新人物TOP 10

表彰人物：华人科学家、学者、企业家、创业者

评委阵容：资深媒体人、AI投资人、AI专业机构等

颁奖：2017年12月，中国乌镇

关注网易智能公众号（ID：smartman163），输入关键词“评奖”，随时获取评奖动态！

Gigaom | 选自

网易见外编译机器人 | 编译

秦昕 | 审校

1991年，Yoshua Bengio获得了加拿大麦吉尔大学计算机科学博士学位。他在麻省理工学院计算机科学与运筹学部担任教授两年之后，在麻省理工学院贝尔实验室担任麻省理工学院计算机科学系的教授。他著有两本书和200多本出版物，被引用最多的是深度学习、周期性神经网络、概率学习算法、自然语言处理和多种学习。他是加拿大最著名的计算机科学家之一，也是机器学习和神经网络顶级杂志的副主编。有人将其与Geoffrey Hinton、Yann LeCun并成为“深度学习三巨头”。（友情提示：读完本文大概需要20分钟）

以下为Oren Etzioni答问实录：

关于无监督学习

【问】那么，让我们开始吧。当人们问你“什么是人工智能”时，你该如何回答呢？

【Yoshua Bengio】人工智能就是制造“聪明”的机器，可以做人类可以做的事情，为了做到这一点，它需要了解世界，然后利用这些知识做一些有用的事情。

【问】但是，这有点像把罐子踢到大街上，因为智能没有一致统一的定义，但这正如你描述它的一样，它是可以完成复杂任务的。所以，你认为它必须对它周围的环境或类似的东西做出反应吗？

【Yoshua Bengio】不一定。你可以想象拥有一个非常智能的搜索引擎，能理解各种各样的东西，但它并不一定有真实的形态，也不是生活在只有人机交互的环境。所以，我们所知道的智能，就像是每当我们想到动物就会自动联系到一些动作和行为一样。但是，智力可以是不同的形式，也可以是在不同的方面。所以，一只老鼠在它的环境中是非常聪明的。如果你或我进入老鼠的头部，试图控制老鼠的肌肉并存活下来，我们可能不会存活很久。如果你理解我所说的定义，你可以在一些领域了解很多东西，从而在某些领域非常聪明，但是却可能对另一个领域知之甚少，在其他领域也不那么聪明。

【问】你是怎样描述当前这项科技的发展水平的？我们可以在哪里应用到人工智能？

【Yoshua Bengio】我们已经在计算机的感知能力、理解图像声音能力甚至可以说在语言表达能力上取得了巨大的进步。但是，我们离发明出自动感知机器的阶段还很远，离创造出可以理解我们话语中高等概念的机器人还很远。所以，还有很多事情要做。

【问】是的，确实。比如，你去问任何一个你可以找到的机器人，当然，我指的是那些已经运行了多年的，为了通过图灵测试而制造的机器人。问它们，“五分硬币和太阳谁更大一些”，至今我还没有找到一个能回答这个问题的机器人。你觉得为什么会这样？这是怎么回事？这是一个很难回答的问题吗？

【Yoshua Bengio】因为这就是人们所说的常识。实际上，它指的是对我们周围世界如何运转的普遍理解，至少从人类的角度来看是这样的。这些通常不是你在书中可以找到的东西。至少不是很明确的。我的意思是，你可能会发现其中一些隐含的内容，但在维基百科上并没有这样的东西，你通常找不到这些知识。这些就是我们从孩提时代就开始学习的知识，有些也是与生俱来的。也就是说，我们知道如何使用它，识别周围的东西，就像我们可以认出一把椅子，但我们不能正式地描述它——换句话说，不可能用一些方程来确切的描述一把椅子是什么。也许我们认为可以做到，但当我们真正被迫去做的时候，却做不到这一点。同样的道理也适用于在围棋比赛中击败世界冠军的AlphaGo系统，它可以用一种直觉来观察比赛状态，然后决定：“下一步怎样走最好？”人类也同样可以通过直觉来做事情而不需要那些清晰简短的描述，就像下棋的方式一样。在国际象棋的例子中，我们有一个程序，它可以尝试很多走法。比如，“如果我这样走，那么对我来说最糟糕的结果可能是什么？”其他人这样走，然后我可以怎样应对，紧接着其他人又那样走，我还可以怎样对抗？所以，这是为什么电脑会这样做的一个非常清晰的逻辑解释。

在神经网络的例子中，我们有一个巨大的带有数百万或数亿参数的人工神经元网络和联结的数字网络。当然，你也可以为此写一个等式，但是这个等式中会有很多数字，所以不可能用此完全解释计算机的行为。同样的事情也发生在我们身上。如果你问一个人，“你为什么要做出这个决定”，他们可能会想出一个故事，但在大多数情况下，这个故事的很多层面他们是无法真正解释的。这就是为什么人类可以通过写下他们知道的东西，并把知识下载到电脑上的。基于专家系统的经典人工智能程序失败了，它失败了，因为我们知道的很多东西都很直观。因此，我们发现唯一的解决方案是，计算机将通过观察人类的行为方式，或者通过观察世界来学习直觉知识，这就是机器学习的意义所在。

【问】所以，当你遇到一个问题，比如“五分硬币和太阳哪个更大？”的时候，你可以做出解答或者是这些常识问题，我们知道如何解决所有的问题吗？我们是否知道怎样创造出我们目前还没有的具有常识的电脑？是我们目前没有算法，还是没有处理能力呢？还是我们不知道如何加点料，或者魔法？

【Yoshua Bengio】是的，我们不知道。我们知道如何解决与之相关的更简单的问题，不同的研究人员可能会有不同的计划，但这还是一个开放的问题，一项解决如何将常识应用到计算机中的研究。我所在地区的许多研究人员认为，我们需要更好的无监督学习，这是其中一个重要的因素。所以，无人监督的学习是指不告知它应该做什么的计算机学习。所以，当电脑通过观察或与外界互动学习时，它不像监督学习，需要我们告诉计算机，“在这种情况下，你应该怎样去做。这相当于在一种情况发生时，人类操控计算机那样去做，在另外一种情况下，人类又做出另外一种控制方式，而计算机只需要学会模仿。或者，你让一个人驾驶汽车，而电脑只是学习在同样的情况下人类司机所做出的反应。这就是所谓的监督学习。无人监督的学习就像是你去读书，自己去尝试一些事情，然后你会找到如何解决问题的方法。这就是无人监督的学习，一种人类非常擅长的学习。拿一个两岁的孩子举例，他知道物理，不知道物理方程式。但是，她知道当她扔下一个球时，球就会掉落。像固体物体和液体物体、压力，所有这些概念，从来没有人告诉过她，她的父母不会一直告诉她，哦，你应该用这个微分方程之类的等等。他们会告诉她其他事情，但她会自己学会这一切。

【问】你会用这个例子来做个类比吗？或者你认为我们可以从孩子获得知识的方式中学到一些东西吗？这些知识对建立能够进行无监督学习的系统是非常有帮助的吗？

【Yoshua Bengio】两者都会。我们可以这样认为这显然是一个类比，并且我们可以在其他情况下进行概括。但是，同样的事实是，至少在人工智能科学领域，一些专家通过研究孩子们的学习方式来研究人类的行为方式，研究我们的大脑是如何工作的。换句话说，从我们知道存在的智慧的形式中获得灵感。我们不能完全理解它，但我们知道它的存在，我们可以观察它，我研究它。当然，生物学和心理学的科学家们已经研究了几十年。

【问】同样地，我们也有神经网络，这同样对大脑有吸引力。

没错。

【问】我们是否已经从大脑中学习了所有能帮助我们建立智能计算机的知识？或者它们真的完全没有什么共同之处。它们是非常不同的系统。

【Yoshua Bengio】如今，成功开展的深度学习领域只是一种现代的神经网络。从50年代开始，神经网络已经存在了几十年。当然，他们的灵感来自于我们对大脑的了解。现在我们知道得更多了，实际上，大脑计算的一些元素最近已经被引入到神经网络中了。与2011年一样，我们在深度神经网络中引入了矫正装置，并证明它们有助于更好地训练更深层次的网络。实际上，它的灵感来自于大脑神经元中存在的非线性问题的计算形式。所以，我们继续把大脑看作是灵感的潜在来源。话虽如此，我们还是不懂大脑。生物学家，神经学家已经做了大量的观察，但他们仍然没有完全搞清楚大脑是如何工作的，最重要的是，对我来说，不知道大脑是如何学习的，这是我们需要在机器学习系统中导入的部分。

有意识的人工智能

【问】所以，从某种角度来看，我们谈论的是常识。你认为我们最终会建立起一个和人类一样能力或者超过人类的通用人工智能系统吗？

【Yoshua Bengio】当然可以。

【问】当你和别人说话的时候，你会说，“我们什么时候会有这个？”我听到是五到五百年。首先，你为什么会这样估计呢？你知道，这显然是两个数量级。你会对我们什么时候能够创造出通用人工智能有异议，就好比你把你的名字扔在帽子里，然后做出预测，你认为我们什么时候会得到一个AGI（通用人工智能）是一样的道理？

【Yoshua Bengio】好吧，确实存在着很多不确定性。所以，这里有一个很好的情景来解释为什么不可能回答这个问题。就好比你在爬山，而现在你在这座山上，看起来它是附近最大的山，如果你真的想爬到这座山的山顶，你就必须先到达那座山的山顶。但是，事实上你看不到那座山的后面是什么，很有可能在你到达山顶后，我们才可能会看到另一个更高的山峰。所以我们还有很多工作要做。现在看起来我们在这座山上取得了很大的进步，某程度上至少在感知方面取得了很大的进步。但是，对于更高的层次，我们仍然处在起步阶段。我们不知道我们目前拥有的工具，以及我们目前所拥有的一些增量式工作的概念是否能让我们实现目标。或者，这种情况可能会在十年内发生，对吧？有了足够的计算能力。或者说，如果我们遇到一些无法预见的障碍，我们可能会被困一百年。所以，这就是为什么我认为给出数字并没有告诉我们很多信息。

【问】我的另一个高度推测性的问题是，你认为我们就会建造出有意识的机器吗？我们能做到吗？在你的脑海中，意识——感知和自我意识的能力，以及所有与意识相关的意识——是建立一个一般智力所必需的吗？或者这是完全不相关的事情？

【Yoshua Bengio】嗯，这取决于我们想要建立什么样的人工智能。所以，我认为你可以很容易地拥有某种形式的智慧但却没有意识。正如我所提到的，一本非常智能的百科全书，它可以回答你的任何问题，但没有任何自我意识。但如果我们想要制造机器人那样的东西，我们可能需要给它们一些自我意识。例如，机器人需要知道它在哪里，以及它是如何与其他物体或代理相比较的。比如如果它被损坏了，那么它需要知道如何避免被损坏。它会有某种原始的情感，有某种方式知道它已经达到了它的目标，你可以把它想成是快乐的或者其他的。因此，意识的成分已经存在于我们正在构建的系统中，但只是非常原始的形式。所以，意识不是一个很明确的东西，这甚至不被人们所认同，没有思考过智力和意识是什么。但我对它的理解是，我们将制造出一种拥有越来越多的意识形态的机器，而这正是我们正在构建的应用程序所需要的。

人工智能在游戏领域的突破

【问】我们的听众主要是商业人士，他们每天都在人工智能领域里不断看到新的突破。那么你将如何建议人们去发现人工智能真的很擅长解决的问题，从而解放双手？比如，如果我在公司从人力资源部门，到市场营销，从产品部，到公司的每一个部门，那么我怎样才可以宣传人工智能的好处呢？

【Yoshua Bengio】这取决于你的时间范围。所以，如果你想要利用的科技应用到当前的任务中，那就不同于说，“我想考虑下五年后会面世的产品或服务。”

【问】前者。你现在能做什么？

【Yoshua Bengio】是的。现在事情已经很明确了。你需要一个非常明确的任务，你有很多关于计算机正确行为的例子。还有很多可能需要耗费数百万美元。这取决于任务的复杂程度。如果你想学的东西很简单，那么你可能需要更少的东西。如果你需要学习一些更复杂的东西…例如，当我们进行机器翻译时，你很容易就会需要成千上万的例子。你需要明确任务目标，这项任务需要计算机的使用，随后知道它需要什么样的信息。这就是输入。之后我们知道它将会作出什么样的决定。这是输出。我们在研究监督学习，目前已经取得了很大的进步。所以，换句话说，我们应该给出计算机一些例子，“对于这些输入，这是它应该产生的输出。”所以，这是一个要素。另一个要素是，并不是所有像这样的任务都很容易被当前的人工智能和深度学习所掌握。有些东西是更容易学的，特别是，人类擅长的事情，范围有限的事情。因为在某种意义上，它们更容易实现，这也会让你更容易学习。如果你能解决这个问题，那么你一定具备很好的常识，必须是非常聪明的，你可能一些事情做的不是很好，因为我们还没有完全解决人工智能。

【问】你之前提到过游戏，我猜，使用人工智能玩游戏的历史由来已久。我的意思是，这要追溯到克劳德香农关于国际象棋的文章。在50年代，IBM有一台电脑来玩跳棋。每个人都知道这些冗长的故事，对吧？首先Deep Blue（IBM的深蓝系统），机器学会了下象棋，然后有了Jeopardy，接着AlphaGo，现在可以玩扑克了。我猜游戏运行得很好，是因为有一个非常明确的规则集合，这是一个很独立的个体。你认为下一个会在电脑游戏领域发生什么样的令人惊叹的突破呢？

【Yoshua Bengio】目前研究人员正在研究一些更复杂的电子游戏。它涉及的虚拟世界比你生活的简单网格世界要复杂得多。还有，围棋和象棋有些不现实的东西。在围棋和国际象棋中，你可以看到整个世界的状态，对吧？这是目前所有作品的情况。当然，在一个更现实的游戏中，或者在更真实的世界里，特工并不知道所有关于世界状态的信息，它只看到了一部分。还有一个问题是我们能得到什么样的数据。所以，游戏的问题，当然也出现在一些其他的应用中，比如对话，你可以给我一组我可以一次性提取的数据，可能是让很多人去执行特定的任务，然后通过模仿来学习。这行不通的原因是，当学习机器使用它自己的策略时，它可能会以不同于人类的方式做事情。所以，如果我们谈论对话，也许我们的对话机器会犯一些人类永远不会犯的错误，所以对话就会变成一种结构，当你看到人们互相交谈的时候，这是从未见过的。所以电脑便不知道该怎么做了，因为这些情况不属于训练的一部分。所以，这意味着，计算机需要与环境进行交互。这就是为什么模拟游戏对研究人员来说非常有趣。因为我们有一个模拟器，在这个模拟器中，计算机可以练习它可能呈现的动作效果，这些取决于它要做什么以及观察到的内容。

我们的孩子会失业么？AI对就业的影响

【问】因此，在……人工智能领域，存在着相当多的担忧和恐慌。尤其是关于工作和自动化的问题，那么在不远的未来，你认为会发生什么呢？

【Yoshua Bengio】就业市场很有可能会出现艰难的转变。根据一些研究，大约一半的工作将受到严重影响。这意味着大量的工作岗位将会消失。一些工作岗位可能不一定需要实际的人来，但他们的工作职责可能会发生变化，因为他们做的很多事情，都是重复性的，可以由电脑来完成，因此我们需要更少的人来完成相同的工作。与此同时，我也认为，这最终会创造出一些新的就业机会，不会造成完全失业的格局，因为仍然有一些工作不想交给计算机的。我不希望我的孩子被机器照顾，我想要一个人与我的孩子们互动，与我的父母交流。所以，对于所有照顾类、教学类工作，在某种程度上，尽管计算机将扮演重要的角色，我想我们还是会希望老师来教课，而不是机器。而现在，我们不能，这个费用太昂贵了。但是一旦可以自动化的工作实现了自动化，那么，我认为那些从事重复工作的人将会失业。还有所有创意型工作的人，没有那么多重复性的工作内容（也不会被取代），当然还有艺术家，科学家，都是我们希望能有更多的人来从事的领域。

话虽如此，但我认为，这将是一种转变，会有很多人失去工作，因为他们不愿意接受培训去做其他的工作。因此，我们必须建立正确的社会网络安全来照顾这些人，也许是提供低保或者其他，但是，我们必须认真思考这个转变，因为它可能会产生巨大的政治影响。想想工业革命的转变，从农业到工业再到19世纪中期到20世纪中期发生的所有人类苦难……如果我们当时采取在第二次世界大战中最终建立起来的社会措施，很多事情本可以避免的。所以，同样地，我们需要思考一下什么才是正确的处理这种转变的方法？当然将会有足够的金钱来支持这些改变，因为人工智能将创造大量财富，许多新型服务的效率更高，因此，从某种意义上说，在全球范围内，我们都将变得更加富有。但问题是，这些钱会流向哪里？我们必须确保其中一些能够帮助我们从人类的角度进行转变。

【问】有趣的是，在这个问题上，你可以让人们分成三个阵营。其中一个说，“终将有一天计算机会比人类更快地学习一项新任务。”从本质上讲，人们将会失去所以基础的工作机会。所有这些都可以通过机器来完成。然后你会听到有人说，“嗯，会有一些流离失所的人，他们通常会对大萧条这样的事情产生兴趣。”也就是说，“有些人会失去工作，而在这个新经济环境下，他们不会接受培训去寻找新的工作。”最后你会遇到这样的人，他们会说：“看。”在过去的三百年，二百五十年的时间里，西方的失业率一直在4%到9%之间。你可以机械化工业，你可以消除农业，你可以发电，你可以去煤炭能源，你可以制造蒸汽——你可以做这些令人震惊的事情，但是你从来没有看到失业率的激增。4%到9%这当然是一个历史事实，而且这种观点认为，到时的失业率不会比现在高。新的工作岗位将会像旧的工作一样被淘汰。所以，任何一个持有另外两种观点的人，他们都有责任说为什么他们认为这一次是不同的。他们总是有理由认为这次不一样。听起来你觉得我们会有大量的工作机会流失，这将会是破坏性的，我们需要一个基本的收入来源。人们的技能和经济需求之间将会出现巨大的不匹配。所以，这听起来像是一段非常动荡的时期。

【Yoshua Bengio】是啊。

【问】那么，你认为这一次有什么不同呢？为什么会说这次不同于之前的，给工业带来电力，带来机械化，或是用机器的力量取代呢？我的意思是，这一次和我们之前发生改变的顺序是不一样的，是吧？

【Yoshua Bengio】所以，我们说的是一种不同的自动化。传统的自动化正在取代人类、体力劳动和潜在的技能，但都是以非常常规的方式。刚开始的新自动化可以处理很多类型的任务。例如在汽车工业以及在农业中，很多体力劳动，密集型任务都得以自动化，因此人们开始迁移到白领工作和服务行业中来。所以，现在还不太清楚职业迁徙何去何从。我认为，未来将会有一场就业结构转移。正如我所说的，人际互动和创造型的工作，在短期时间内机器是无法取代的。但另一个因素是速度。我认为，发展会比过去要快的多，这就意味着人们没有时间去退休，他们的工作也不会被取代。他们会在30多岁、40多岁或50多岁的时候失去工作，当然，这也会造成破坏性的影响。

【问】当我谈到这个话题时，我被问到的首要问题是，“我的孩子们应该学习什么，这样他们在五十年后就能被雇佣（而不会失业）？”答案可能是，“去做一些需要感情投入的工作以及有创造力的东西。”还有其他类型的工作可以化为此类吗？

【Yoshua Bengio】显然，这些计算机必须由一些人来建造，所以我们需要科学家，程序员等等。这种情况将持续一段时间。但这只是人口的一小部分。我认为，我们将更多的需要那些可以从事科学工作、工程和计算机相关工作的人，这种情况短期内不会改变。正如你所说的，我认为人与人之间交流的工作，也将需要更多。基本上，我们将会有更多的额外财富，有些人将会有额外的财富。也许，你在一家公司工作，比如谷歌，你的薪水很高，现在你可以用这笔钱把你的孩子送到一所学校，那里一个班只有五个孩子，而不是三十个。

机器人与人工智能的结合

【问】一般情况下，与人工智能相提并论的还有机器人的讨论。头脑和身体都可以被科技所替代。但是机器人的发展速度似乎要慢得多。我的意思是，如果有摩尔定律，他们两年多就可以翻倍。你对机器人和人工智能的结合有什么想法吗，机器人需要人工智能吗，我们需要用人工智能来学习吗？或者仅仅是苹果和橘子的关系。他们之间没有任何关系？

【Yoshua Bengio】当然，它们之间有很多的联系。我相信你可以没有身体就拥有智慧。但是，我也相信，有一个身体，或者某种类似身体的东西，我稍后会解释，可能是达到这种智力的一个重要因素。所以，我认为通过与世界互动我们可以学到很多东西。我认为机器人与环境互动的想法很重要。现在，机器人本身就有了腿和胳膊，我希望它的进展会比虚拟的智能要慢。因为机器人的研究周期较慢，需要不断的去进行真实的测试来建造它、对它进行编程。更重要的是，机器人需要时间来进行互动，而一个机器人只能学习这么多东西。但如果你有一个机器人，换句话说，它是一种可以与人互动的智能载体，它将可以与数百万甚至数十亿人进行互动。所以，它可以有互动，但它们不是物理互动而是虚拟互动，可以从大量数据中学习，就像网络上的一切。因此，我敢打赌，我们将会看到人工智能在虚拟机器人上的进步，而不是真正的物理机器人。但最终，我认为我们也会实现物理机器人的突破，只不过速度会有所不同。

机器翻译与创造力

【问】你提到的一个你非常感兴趣的领域是自然语言处理。每当我呼叫我的航空公司时，我必须说出我的8位会员号。如果我戴上耳机说便会出现识别的错误。所以，我总是要拔掉我的头戴设备，对着手机来说。然而，在其他程序中，如亚马逊的Alexa或谷歌的助手，以及所有这些，似乎能够理解完整的段落和句子，并且能够捕捉到正确的释义。那么在这两种截然不同的体验中，我究竟经历了什么呢？是因为在第一个案例中没有上下文，所以它真的不知道如何猜测8到H和A之间的关系？

【Yoshua Bengio】所以，现在的系统并不是很聪明，有些系统根本就不聪明。机器学习方法只在那些已部署的系统中使用，它们仍然只被用于系统的某些部分。顺便说一句，现在的自动驾驶汽车也是如此。系统的设计或多或少是手工设计的，但有些功能，比如识别行人，或者语言识别，都只是通过名字来判断从而识别你在谈论的人;这些功能是由受监督学习训练的独立培训的模块完成的。这就是现在的情况。从语言理解的角度来说，目前的这种科技发展状态让这些系统能够很好地理解你所谈论的话题，甚至是你所说的内容。但是，他们仍然不擅长做出我们所认为的理性判断和推理。所以，像机器翻译这样的东西，在某种程度上已经取得了很大的进步，部分原因是我们在实验室里做的事情，你可以让电脑理解句子的意思，并且使用，这些细节可以作为一个定义好翻译的标准。但是，在有复杂语义模糊的情况下，你仍然可能会出错。所以，还有一些机器不太擅长的事情，包括高层次的理解和类比。

【问】你提到过，你对需要人类创造力的工作很乐观。我一直对人工智能研究人员的数量感到惊讶，他们对创造力不屑一顾。他们不认为有什么特别或有趣的东西，他们认为电脑会比其他平凡的东西更有创造力。你对人类创造力有什么看法？

【Yoshua Bengio】实际上，我一直在研究创造力，我们对其有不同的名称。在我的领域，我们称之为生成模型。所以，我们有可以生成图像的神经网络，这是我们做得最多的事情。但现在我们也在做声音和语音的生成，如果我们能看到足够多的此类物体的例子，我们就有可能合成任何种类的物体。因此，电脑可以查看自然图像的样本，然后创建一些看起来非常现实的新图像。不过，很明显，你可以看出它们并不是真的，但你可以清楚地看到物体是什么。因此，我们已经在计算机的能力上取得了很大的进步，可以想象合成图像、声音或句子。所以，在某种意义上，电脑是有创造力的，它可以创造新的诗歌，或者新的音乐。唯一的问题是，从人类的角度来看，它的创造并没有那么伟大。从这个意义上说，它不是原创，也不令人惊讶，它仍然不像人类能做的那样好。所以，虽然计算机可以很有创造力，我们有很多研究让计算机产生各种看起来合理的新事物，但我们离人类在这方面的能力还差得很远。所以，就像我一开始提到的核心问题一样，现在的电脑没有常识，他们对世界的运作方式没有足够的理解。如果没有这种常识，如果没有对高层次解释和因果关系之间的因果关系的理解，那仍然是缺失的。在这之前，人类的创造力将会远远超过机器。

【问】几个月前我重新看了《白鲸》，现在我可能要错误的引用它，。“他的愤怒和愤怒的总和在鲸鱼的白色驼峰上堆积起来。如果他的胸部装有大炮，他就会把自己的心射到上面。“我读了这篇文章，把书放下，然后我想，“电脑怎么能做到这一点呢？”这里有一些丰富而美丽的比喻。“如果他的胸上装有一个大炮，他就会把他的心射到上面。”为什么是这个呢？然后便有这样一个问题被提出：创造力是否只是计算性的？它真的是可以简化的，“向我展示足够多的例子，我将开始类比，并提出其他的例子。”你认为会有Herman Melville AI在早餐前写这样的东西？

【Yoshua Bengio】我真的相信创造力是计算性的。就像我之前说的，这是我们可以在小规模范围内做的事情。这是我们理解背后的原则。所以，这仅仅是拥有，但是神经网络或者是更聪明的模型，能更好地理解世界。所以，我不认为人类的任何一种能力是与生俱来的。我想说的是，人类的某些方面是不那么容易接近的，我们所欣赏的那种创造力可能会花更多的时间去实现。对电脑来说，也许更困难，但也很重要的是，不仅要理解人类的情感，还要理解一些更抽象的东西，这就是我们对什么是对，什么是错的感觉。这实际上是一个很重要的问题，因为当我们要把这些电脑放到世界上，他们会做出决定，对于一些非常简单的事情我们知道如何定义任务，但有时计算机需要在完成它想做的任务和在世界上做坏事之间做出妥协。所以，它需要知道什么是坏的。什么是道德上的错误？什么是社会可接受的？而且，我认为我们将设法训练计算机来理解这一点，但这也需要一段时间。

【问】你提到过几次机器翻译。任何关注文学作品的人都知道，正如你之前所说的，我们的机器翻译能力已经取得了一些真正的突破。你能否用更通俗的说法来描述一下到底发生了什么变化？什么是“顿悟时刻”，或者说数据集是什么，或者是什么让我们获得了巨大的提升？

【Yoshua Bengio】我想说两件事，其中一个实际上可以追溯到我在2000年左右的工作。我们称之为词嵌或词表示。我们训练计算机将每一个单词与激活模式联系起来。你可以把它想象成大脑中神经元的激活模式。所以，这是一堆数字。有趣的是，你可以把它想象成一个语义空间。猫和狗只是两个词，任何两个词都是符号，没有任何东西。但是，如果你看一看猫的图片，或者你看到狗的图片，或者你看看我们的神经网络，看看这些网络中的人造神经元是如何对猫的图片、狗的图片或者是关于猫或狗的文字的图片做出反应的，这些模式是非常相似的。因为猫和狗有很多共同之处。他们是宠物，我们和他们有特殊的关系等等。因此，我们可以用它来帮助计算机正确地推广新案例。即使是那些从未见过的新词，因为也许我们从未见过这个词的翻译，但我们已经看到它与同一语言中的其他词汇有联系。

我们可以建立一些关联，让计算机将符号从句子中映射到这些语义空间，在这些语义空间中，句子或多或少意味着相同的东西，或多或少地以相同的方式表示。所以现在你可以从法语的句子到这种语义空间，然后从语义空间中，你可以翻译成英语。所以，这是机器翻译在深度学习方面的成功的一个方面。另一方面，当我们意识到我们可以使用一种叫做注意力机制的东西来帮助机器翻译时，我们确实取得了巨大的突破。所以，这个想法其实很容易解释。想象一下你想把整本书从法语翻译成英语。它建立了这种语义表示，比如，你知道所有这些神经元的激活，然后用英语来写这本书。但这是非常困难的，你必须把整本书都记在脑子里。相反，更好的方法是，我将在同一时刻翻译一个句子。或者就像在每本书中追踪一样，在我生成英文书或法文书的时候，标记我所在的位置所以，当我已经用法语翻译过来了，便可以就近查找下一个单词在英语里应该是什么。因此，我们使用的是注意力机制，这使得计算机能够更准确地聚焦到书的某些部分，这里指的便是你想要翻译的部分。这当然是受到了人类的启发。使用注意力机制，不仅仅是作为一个外部设备，当我看着眼前的东西时，我不仅关注它的一个特定部分，同时也关注内部结构。我们可以用自己的注意力来回顾我们所看到或听到的不同方面，这对我们所有的认知任务都非常有用。

未来，人工智能的发展速度可能会加快

【问】在你的脑海中，是否还会有这样的感觉：“你什么都没看到？”等等？”或者，“这是我们今天所知道的80%的事情，所以不要指望很快会有重大突破？”

【Yoshua Bengio】好吧，这就像你问了多少年的问题。但我想说的是，人工智能领域的发展速度极有可能会加快。这出于一个非常简单的数学原因。目前从事该研究的研究人员数量呈指数级增长。科学工作的进步是一小步一小步的。科学进步的影响可能是非常巨大的，因为我们通过了一个门槛，可能突然就可以解决这个问题，便可以开发这个产品。但科学本身只是思想和概念的积累，是非常循序渐进的。人们做得越多，我们取得进步的速度就越快。我们投入的资金越多，设施和计算设备越好，我们就能越快地取得进展。因此，由于目前在人工智能领域有一笔巨大的投资，无论是在学术界还是在工业领域，进步的速度和论文发表的速度都在飞快地增长。所以，这并不意味着我们可能不会面临一些困难，我们可能会在几年的时间里努力解决一个非常困难的问题。我的猜测是，这种情况会持续一段时间。

【问】还有两个问题。首先，你住在加拿大，在那里做了很多工作。我看到越来越多的人工智能、写作和出版物，以及来自加拿大的信息。我看到加拿大政府正在资助一些人工智能项目。在加拿大，人工智能的投资比例似乎是不均衡的吗？

【Yoshua Bengio】这是事实，而且，事实上，加拿大从深度学习开始就一直是深度学习的领导者。所以，有两个主要的实验室在研究这个，我在蒙特利尔的小组，和Geoff Hinton一起。另一个重要的地方是在纽约，有Yann?LeCun，最后是斯坦福，还有其他一些团体。但是，深度学习的很多最初的突破都发生在这里，而且我们还在继续发展。例如，在蒙特利尔，在学术研究方面，我们有世界上最大的进行深度学习的群体。所以，在人工智能领域，加拿大有很多论文和技术进步。我们在Rich Sutton的埃德蒙顿也有，这是强化学习的教父之一。所科学的进步，科学的专业知识，到目前为止，加拿大非常强大的，并且已经出口了。因为我们的科学家大多是被美国公司挖走的。但是，加拿大政府已经明白，如果他们想从人工智能中获得一些财富，从而让加拿大受益，那么我们需要一个加拿大的人工智能产业。因此，私人部门现在有很多投资，政府也在研究中心投资。他们将在蒙特利尔、多伦多和埃德蒙顿建立这些研究所。而且，你知道，很多公司都涌向蒙特利尔。来自世界各地的专家来到这里做研究，建立公司。所以，这是一个惊人的发展势头。

【问】最后，你现在在做什么？令你振奋的事情是什么？你早上醒来后最想要做的工作是什么？

啊，我喜欢这个问题。我试图设计学习程序，让机器能够理解这个世界，我认为如果机器能代表它看到的东西，就能做到这一点。所以，它会看到图片，文字之类的东西。但是，用另一种形式来表示它，我把它叫做“分离”。换句话说，试图将世界的不同方面，我们所观察到的不同原因分开。这很难。我们知道这很难，但实际上这是十多年前我们为自己设定的目标。当我们开始深度学习的时候我和Yann LeCun写了一篇关于分离“好”的重要性。而新事物则是整合强化学习，学习系统和学习代理与世界互动，以便更好地理解因果关系，从而把不同的原因分开，以这种方式来理解这个世界。我说的有点抽象，但我们假设这是基础研究。我们可能需要几十年才能达到成熟。但我认为这非常重要。（完）

管长夜漫漫。

注：《AI英雄》专访隶属网易智能工作室，每周围绕人工智能领域讲述一个人物故事。如需转载本文需经网易智能同意，违者必究！