Michael I. Jordan：或许该对 AI 教学进行一些思考

2018 年 11 月 15 日 AI科技评论

AI 科技评论按：11 月 15 日，「全球 AI+智适应教育峰会」在北京嘉里中心大酒店盛大开幕，峰会由雷锋网联合乂学教育松鼠 AI，以及 IEEE（美国电气电子工程师学会）教育工程和自适应教育标准工作组共同举办，汇聚国内外顶尖阵容。

AI 智适应学习是目前产学研三界关注度最高的话题之一。此次峰会邀请到美国三院院士、机器学习泰斗 Michael Jordan，全球公认机器学习之父 Tom Mitchell，斯坦福国际研究院（SRI）副总裁 Robert Pearlstein、美国大学入学考试机构 ACT 学习方案组高级研究科学家 Michael Yudelson 等顶尖学者。

在大会上午主论坛上，Michael Jordan 带来了一场精彩的主题演讲《以人类为中心的人工智能原理：计算、统计学和经济学》。以下为他的演讲内容，雷锋网 AI 科技评论整理。

Michael Jordan：大家好，非常高兴可以来到这里，我对教育话题非常感兴趣。我既是一名研究人员，同时也是一名教育者，我整个职业生涯都是作为教授来工作，同时我也是一名学习者，非常高兴有这样的机会，跟大家一起学习。

AI 与学习

我们现在会使用很多数据以及学习方法，让学习更加简单，这是一个非常好的时代。今天我会谈谈 AI 与学习的互相补充，我们谈到 AI 促进学习，那什么是 AI？我们可以教育 AI 吗？AI 现在可能还不是很清楚的概念，现在仍在不断变化，在接下来的几十年间也会有很多变化，那么我们应该怎样教育，怎样在 AI 快速发展的时代进行更好的教育？

说到 AI，我认为我们并不是要复制人的智能或智慧，而是要建立一个新的智能系统。

机器学习融合了统计学和算法，数据科学也引入了数据库和分布式系统，而且数据科学比机器学习更易受到研究者青睐。可以给大家举一个经济学的概念，我们会把所有的东西联系在一起。

谈一下新兴的技术以及其他学科，其中包括决策、数据、人类的推理。数据会处于中心，其中会包括各种不同的学科，比如土木工程、化学工程。

「机器学习」、「数据科学」、「人工智能」都是一些概念，涉及到计算机系统，以数据为基础。不同阶段会有不同的研究人员，会有不同的使用方法，但是关键要有数据的分析。

如何演化计算机科学？首先我们需要有数据，怎么样能把数据进行扩展和分析，我们现在讨论 AI 的时候，经常忽略的是经济方面的因素。把不同的元素、机构联系起来，这样才能通过互动有更好的结果。

现在在 AI 的世界里还没有讨论到很多这方面的内容，可能更多的是要模仿人类，在经济方面会有所忽略。

AI 已经被用在很多方面了，现在比较传统的 AI 的概念就是模仿人类。超人式的 AI 现在并没有出现，我们还有很长的一段路要走。过去 40 年间真正发生的是智能增强，包括数据处理、数据分析，还有推荐系统。

我认为我们是想要建设人工智能系统的，而且这样的人工智能并不是要取代人类，而是让我们有一种新的方式变得更加智慧。

过去几十年间，包括现在，智能基础设施一直在发展，包括数据的流动，我们会和设备进行互动。我们有这样一个希望，想要被设备所理解，同时也想要理解他人。现在我们需要有这样的理解，同时也会做出一些妥协。

我想说一下我们现在面临的挑战，事实上这更多的是关于决策方面的内容，决策的不确定性。这里有神经科学、神经系统，我们会使用 AI 这样一个标签，但事实上还不够，所以需要做出好的决策。

怎么样做出决策？这会有很多不确定性，另外我们还会考虑多重决策。人类可以一个接着一个做出不同的决策，机器可以在同时做出很多决策，比如说滴滴、Uber，每小时随时随地都可以做出很多决策，让不同的司机去接不同的乘客，这样的一些决策都是相互连接的，人类并不是非常善于同时做出决策。

有两个非常重要并且相关的问题，我们怎么样教育传统的人工智能、新的智能增强和智能基础设施。这里融合了不同的学科。第二个问题是我们如何使用这样一些概念来教学？这两个问题是相关的，我主要介绍第一个问题。因为我知道很多其他大会都会关注第二个问题，这样两个问题都能迎刃而解。

如何教育传统的人工智能、新的智能增强和智能基础设施

首先我想跟大家说一下我在伯克利的工作，我们有一个「数据 8」的课程，将计算思维和推理思维连接在一起。我的同事教这个课的第一版，那是三年前。现在我也在教授这样一门课程，这门课程是关于数据科学的基础，它将计算机科学和统计学联系起来，就像机器学习一样，但是比机器学习要更广泛。

我们是教大一新生，他们刚入学的时候就会上这样的课程，当时不会有数学教学，但是会基于计算机来进行算法和编程方面的教学。我们在加州伯克利分校每个学期都会教超过一千名学生，接下来还会有很快速的增长，现在这个课程大家可以免费在网上下载。

我们第一期的课程非常受欢迎，男生女生都有，也有来自不同背景的学生。现在在数据科学这个领域中，我们希望有一些人才，能够既做数据又做计算。之前的科学家他们都会说，大家应该学习一些计算机技术，我觉得这个观点有点狭隘，大家学的应该不仅仅是编程，应该学习一些基本的计算机能力和统计学能力。我们会使用抽样和再抽样这些来自统计学的观点，把它们引入到计算机当中。

我是一个统计学家，我个人对这个观点比较感兴趣，我们要发现数据背后其实隐藏着很多东西。我们首先要知道数据来自于哪里，我们要检索数据背后的真实世界中的源头，这是我在计算机科学世界中学到的东西。

我们应该怎么去做呢？不仅仅要教编程、统计学，有时候要把两者结合起来，计算思维和推理思维是强大的伙伴。

给大家举几个例子，在计算机科学行业当中我们往往会做 A/B 测试，有些计算机专业学生不会做这样的测试，因为它有关统计学。A/B 测试是什么呢？它对比了两种情况。比如说有两列，每列是 1 万名学生，有对照组和实验组，另外还有对之前网页的访问量和之后网页的访问量进行对照。在这个过程当中有非常多的问题。

我们要给网页做一些改变，再针对实验组做一些处理，这就涉及到现代的统计学。

这个方法到底是什么呢？在这张 PPT 里有详细解释。

当然有些人会觉得这个测试比较无聊，但是在这个过程中你可以教大家一些知识，这样学生会更有兴趣。在这个过程中他们会学到数学，而且在这个过程中会获得很多真实的数据，这些数据让人觉得非常兴奋。

我再给大家举几个例子，我们做了很多项目，当然我个人并不觉得这是非常标准的计算机课程，它们在美国却非常流行。大家知道我们对待数据要非常小心，尤其是涉及到隐私问题。有时候我们要给数据进行加密，比如说我们要管理数据隐私和数据使用之间的权衡，会有隐私差分量化的方式，这是一种比较新的技术。

我们首先要进行数据的处理，而不是立刻挖掘数据背后到底是什么。比如说银行数据中包括人的名字以及他们居住的地方，在医疗数据方面我们也有相关数据库，包括人的年龄、寿命以及他们在什么时候获得什么样的治疗，我们想对这个病人的数据进行隐私化。

我们可以在人口当中做一个查询，查询之后我们就能获得数据，这往往是统计学家做的事情。我们要确保既能用数据做相关业务，又能确保数据的隐私化，这是统计学和计算方面的课程，使用数据的同时能确保数据的隐私性。

我们在教授这些想法的时候，会把这些想法用课程传递出去，我们发现在不同的项目中会有一些相似点。在美国会有陪审团，他们往往会从居民中随机抽样，我们可以看到陪审团中不同民族或者男女的比例是不是和总人数的比例一样，这跟 A/B 测试是一样的，学生们会觉得这样的测试非常有趣，因为他们可以用 A/B 测试的方式进行陪审团的选取，这也会影响到策略制定。还有歌词的分类，到底一个音乐是嘻哈音乐还是乡村音乐，这也跟 A/B 测试有关。

除了核心课程之外还会一些「连接者」课程，这是在某一特定领域的数据科学，比如社会学或基因遗传学等等。一些「连接者」课程的例子包括《智能城市的数据科学》、《数据科学和思维》、《地理数据探索》、《历史如何计算》等。

我们要教授一些核心想法，也要进行跨学科合作。数据科学会触及到很多不同学科，尤其会关注到人工智能。

将 AI 与经济学相结合

人工智能到底是什么？计算机还没那么聪明，他们只是利用数据模仿人的智能。我们要把计算机变得更加智能，要让计算机去模拟人的大脑，这也是 AI 当前做的一些事情，但是我觉得这并不是 AI 的主要目标。此外还有其他人工智能系统。

人工智能的概念到底是什么？人类的智能肯定是智能中的一种。比如说在北京有很多饭店，每天会进很多食物，一年 365 天。在采购食物的过程中就有很多决策要做，比如说采购什么样的蔬菜、肉类等等，需要有很多智能投入才能做出这样的决策。想要模拟人的智能目前还非常难，但是我们可以模拟经济系统，其实经济系统也是非常智能化的，这样就能把经济的理论应用在计算机中。

现在计算机获得了很多数据，能够创造一个新的市场，但大多数情况下是要给人提供服务的，这样能够有更好的广告营销，去赚更多的钱。未来的搜索引擎会创造出一个新的市场，这样人们会有更大的意愿参与，获得更大的价值。

我给大家举一个例子，人类的创意事实上还没有进入到市场。现在已经有越来越多的人正在创作音乐并把它们放到诸如 SoundCloud 的网站上，现在也有越来越多的人在听音乐，真正的市场规则应该是做音乐的人和听音乐的人之间存在一些经济联系，但是现在没有这样的联系，这样的连接应该能创造一些价值。

我们该怎么做呢？我们可以建立一个市场。首先对于做音乐的人来说，我们可以做一个 dashboard 让其知道他们的听众在哪，有了这些数据之后，可以使用这个数据，让音乐家在有听众的地方演出。然后音乐家可以向他们的粉丝提供报价，例如在粉丝的婚礼上唱歌。这样一来生产者和消费者就联系起来了，就会产生更多的收益。但我们现在并没有把生产者和消费者联系起来。

我相信不光在音乐方面，在很多其他方面，例如个人服务、信息服务方面都是如此。

最后几分钟跟大家说一下多决策过程，在这样的过程中没有经济的参与，只是在不同的人中做了不同的决策。有这样一个经典推荐的过程，比如说亚马逊或阿里巴巴向大家推荐电影，现在给两个人或者两千个人推荐了同一部电影，大家觉得有问题吗？没问题。如果我把同一本书推荐给两万人甚至二十万人，我认为这本书是好书，有问题吗？可能也没有问题。

但是在吃饭时呢？要是系统给我推荐了我想吃的菜，而不是把同样的餐厅推荐给 100 个人甚至 1000 个人，它就是个性化的过程。在机场外部，如果给所有司机推荐一条路，如果大家都走这条路，就会产生交通拥堵。推荐同一支股票给大家，也会引发股市上的一些问题。

这样的一些原则在经济学上是可以适用的，过去几十年我一直在学习这些原则的应用。