对话英伟达副总裁Bryan Catanzaro ：AI 是未来几十年生产力进步的源泉

2017 年 11 月 28 日 EGONetworks 将门创投

声明 | 本文授权转载自将门创投（ thejiangmen ）

编译 | Tom R

写在前面

Bryan Catanzaro

Bryan Catanzaro 现任英伟达副总裁、深度学习应用研究部负责人，他于 2011 年加入英伟达任职研究科学家，在此期间领导研发了目前深度学习中不可或缺的 cuDNN 库。他还曾在百度硅谷实验室工作，为基于超大规模数据集的中英文端到端语音识别模型研发了高效的训练算法。

Bryan 在加州大学伯克利分校攻读博士期间，开发了 Copperhead 语言和编译器，使得 Python 程序员可以高效的使用嵌套数据。他在杨百翰大学就读本科和研究生期间，主要致力于基于 FPGA 的计算研究。

近日，Bryan 接受了 Gigaom 的访问，分享了他对时下关于人工智能的发展、应用方向、公众接受度等热点话题的独到见解。

你眼里的人工智能是什么？

我认为的人工智能是创造能进行智能工作的工具，这些工具可以帮助人们更高效的工作。对于人工智能有各种各样的定义和理解，我所理解的可能是比较狭义的一种，但这也许是更贴近于现实的一种。

人工智能之所以改变了如此多的公司以及世界的经济活动，是因为它实实在在的帮助人们在工作中提高了生产力。我们曾经利用一系列机器帮助人们完成体力劳动从而创造了辉煌的工业文明，如今人工智能将要做的是创造工具帮助人们完成更多的脑力劳动。

既然你谈到了智能的工作就是人工智能，那么到底什么是智能呢？人工智能真的很聪明还是只是看起来是智能？我们称之为人工是否仅仅是由于我们创造了它？

我很喜欢《人类简史》的作者 Yuval Harari 的观点，智能更像是一种做事情的能力，而意识则更趋向于自我认知和推理判断。我认为目前正在不断发展和构建的智能系统可以进行我刚刚所说的智能的工作。

例如理解数据，或是通过视觉、听觉等各种传感器以及语音和文本等等来理解周遭的世界，并以相应的形式保存下来。计算机通过解读数据并做出决策的过程就是一种智能的工作，这使得我们可以建造越来越智能的机器。我觉得现在对于人工智能的定义逐渐倾向于意识和知觉，但这还有很长的路要走。

虽然很多人对于构建通用人工智能十分狂热，但我认为这不仅遥远而且我们现在甚至都没办法去定义通用人工智能到底是什么。我目前的主要工作集中于实践方面，既如何帮助机器更好得理解数据并基于它进行决策。

假设我的院子里有个检测周围环境的洒水车，草地快干了它就会过去浇水，这是否属于 AI 呢？

这是很小的一种 AI 形式。你的洒水车可以比人更加精确的计算出草地何时需要浇水。它能综合各种传感器信息和历史数据来进行分析，它也许在如何给草地浇水方面比人类更加智能。

这是一种十分狭义的人工智能，但是却十分有用，所以我认为这确实可以被理解成是智能的一种形式。

我们现在处于 AI 的什么阶段呢？

我认为我们才刚刚开始。近几年我们取得了惊人的进展，并应用于各个领域。最早从图像识别和语音识别开始的人工智能已经远远的超出了它早先的邻域，进入到了全新的世界。如今的很多产品上都有了 AI 的身影，整个互联网都在利用 AI 来提升自己的效率。

它为我们提供了便捷的搜索和信息推送服务，提供了社交媒体的反馈，提供了推荐算法和映射，以及像 Siri 和安卓助手一样的对话交互方式。所有这些都由 AI 在背后驱动着，并提供着巨大的价值，但我们的确还处于 AI 发展的开始阶段。还有很多的事情我们还不知道如何解决，还有很多的问题需要探索和研究。

我坚信在不远的将来，AI 将为我们带来更多的应用，引领我们走向更远的地方。

目前有哪些是人类正在从事而计算机很难完成的任务呢？

我认为人类在认识世界改造世界已经有很长的历史了，我们拥有很多内建的知识和世界模型来帮助我们处理感知到的信息。这其中包括本能也包括学习到的知识。

我的孩子在很小的时候会花很多时间在重复的观察这个世界，去看环境对于他们的行为会有怎样反应，例如去玩弄一根弹簧或者球，一遍一遍的重复中他们努力地构建起了对于世界的模型。

我们对于世界实际上拥有十分复杂的模型，使得我们可以很轻松的完成很多事情。这些东西并不是在学习里学到的，但是却十分的有用，它们比今天我们构建 AI 系统中的模型更加复杂精密也更加通用。

对于迁移学习来说，我认为对于眼睛能够看到的这一领域来说已经做的很好了。但也有可能会存在很多 AI 可以利用迁移学习做的更好的领域。

AI 的实现仅仅只需要像小孩一样在环境中摸索吗？

虽然我个人没有致力于通用人工智能的研究，但很多这一领域的人认为人类孩童时期的学习过程对于 AI 十分有用。我的确认为儿童时期对于人类智能的发展十分重要，这帮助我们建立和标定了世界运行的模型，随后应用在生活的方方面面。

计算机需要这些吗？很有可能！我觉得计算机唯一的不同在于它可以更好的利用迁移学习，只需要训练一次就可以重复的使用，而不像人类需要耗时的重复这一过程。

迁移学习并不是真正的通用人工智能，我们给计算机数百万张猫的图片教会它识别猫，但要再教会它识别鸟的话一切是不是又需要重头再来呢？

我并不觉得我们需要重头开始，大多说情况下如果要创建一个新的分类器，人们会从一个经过多种物体训练的现存分类器开始进性迁移学习。

这不是很难，至少在图像识别领域迁移学习的表现很好。虽然在其他领域可能会遇到一些小小的挑战，但在图像识别中，我们可以找到一些十分有用的高级特征来区分物体的类别。

从深蓝到沃森、再到 AlphaGo ，我觉得这主要是由于在限制环境中的游戏判断胜负和得分比较简单。那么接下来这个领域将怎样发展呢？

我脑海中最先想到的事情就是自动驾驶。我认为这会从驾驶室中解放人类并将深刻地变革社会的组织方式，还将赋予人类前所未有的移动能力。

我有家人因为医生判断没有能力安全驾车从而限制了他们的行动能力，让他们感到很沮丧。但这一切都会因自动驾驶而改变。自动驾驶将会改变我们的生活方式，改变不动产的市场状况，同样新型的物流系统将会深刻地改变经济构成和发展。

我认为帮助机器人可以驾驶汽车的人工智能是最令我激动的方面，而且这也在真正改变着世界。

你是否认为将会有像 AlphaGo 打败李世石一样的里程碑式的事件呢？

我现在还不清楚。就自动驾驶来说，我们现在还不具备可以全自动驾驶的汽车。但我认为自动驾驶卡车可以把货物运到全国各地，这将从根本上改变我们的物流方式。我认为我们现在正在经历着自动驾驶的变革，但人们感受到的是一个个独立的技术逐渐循序渐进的被融入到产品之中的。

无论是游戏还是货运，计算机都做的比人类好。但很有趣的是硅谷经常会用直线思维思考问题。很多人认为一个人更聪明是由于他 SAT 分数更高或者 IQ 更高。相应的就把这种判断方式外推到对人工智能的判断上。由于在围棋上战胜了人类，人们就会觉得越来越聪明的人工智能威胁到了自己，这也是 AlphGo 带来巨大影响的原因。

但我觉得智能是多维度的存在。事实上计算机围棋下的好对我的生活没有实质性的影响，因为我不擅长围棋也不玩围棋，围棋并不是我的智力中重要的一部分。同样，当深蓝战胜卡斯帕罗夫的时候我并没有觉得自己的智力受到了威胁。

我的自我认同是由我的工作以及对世界做出的贡献，以及什么对我来说是快乐的事情而定义的。我认为智能是多层面的内容，甚至包括成千上万的方面，而不是上述的哪种直线思维的想法。

正因为这样我才觉得我们目睹着智能的发展，出现了越来越多的智能机器，但他们大多是在一个很窄的特定领域中变得越来越厉害的。电脑下围棋比人更厉害或者机器人可以驾驶的比我更好，这很有用，但却不会改变我对于自己工作，价值和快乐的看法。

我依旧认为还有很多的维度是人类智力的保留地，计算机需要很长很长的时间才有可能在所有的方面达到这一水平。

你认为在 AI 的三大要素 —— 硬件、数据、算法中，哪一个是更为重要的？

我认为数据是其中最为重要的部分。我认为目前使用的算法，无论是变形还是改进都已经存在了很多年了。在我读博士的时候，所有的聪明人都告诉我不要碰深度学习，因为它根本无法解决问题，随后我转向了支持向量机，一个似乎会成为终极算法的算法。

但在后来深度学习模型由于大量的数据获得了成功。我并不认为深度学习是终极算法，因为它像一片迷雾一样。如果要解决问题还需要人类进行大量的工作。

深度学习里有很多新的术语，有没有哪个让你觉得特别反感的呢？

每个人都有反感的，对于我来说 neuromorphic（神经形态、仿神经）是最讨厌的词。每次听到这个词我都会神经质般的反应，因为我根本不认为我们了解神经或者神经的原理。

虽然为神经建模是模拟大脑的重要步骤，但是那还有很长的路要走。我一直在等待别人证明我是错的，但目前为止我还很讨厌这个词。

责任编辑：李雨侬

登录查看更多

相关内容

英伟达（NVIDIA）

关注 25

NVIDIA（全称NVIDIA Corporation，NASDAQ：NVDA，发音：IPA：/ɛnvɪdɪə/，台湾官方中文名为輝達），创立于1993年4月，是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心，例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列，为专业工作站而设计的Quadro系列，以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆（Fabless）IC半导体设计公司。"NVIDIA"的读音与英文"video"相似，亦与西班牙文evidia（英文"envy"）相似。现任总裁为黄仁勋。

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

【CCF计算机视觉专委会】未来5-10年计算机视觉发展趋势，

专知会员服务

104+阅读 · 2020年5月20日

【人大】大规模知识图谱补全技术的研究进展

专知会员服务

87+阅读 · 2020年5月2日

工程领域大数据和人工智能原则

专知会员服务

125+阅读 · 2020年3月26日