Michael I. Jordan：我们并非处于AI大爆炸时代

会员服务 ·

Michael I. Jordan：我们并非处于AI大爆炸时代

2017 年 9 月 12 日 THU数据派

来源：混沌大学

本文长度为5700字，建议阅读7分钟

在人工智能成为炙手可热的话题之后，前百度首席科学家吴恩达的导师、被誉为人工智能领域的“根目录”之一的Michael I. Jordan教授希望能够让人们更准确地认知AI领域。

本文整理自Michael I. Jordan 9月9日在混沌大学的课程《人工智能-机器学习：观点与挑战》。

Michael I. Jordan

加州大学伯克利分校教授、美国三院院士

目前，人们讲到人工智能和机器学习，可能还是觉得它很复杂。

事实上，当你听过我的课程，就会发现，关于这个话题，有很多还停留在概念性、战略性的阶段。当然，也有一些投入实际应用的技术，但这背后的理论，还是非常基础和简单的。

人工智能与机器学习，其实还远远不是一门基础扎实的工程学科，它并不能为现在用数据分析问题提供强大且可拓展的解决方案。

因此，我们并不能将人工智能与机器学习的发展简单理解为一个神迹，如同高楼非一夜而起，它是必须要经历长时间的发展的。

大家首先要意识到，在这一领域，我们仍处于非常初级的阶段。很多事情我们还不了解，现今的我们并非处于一个人工智能的神奇大爆炸时代。

可以说，我们有可能要花上百年的时间，这个高楼大厦才能真正地建立起来。

准确认知人工智能的现在与未来

本节要点：

目前的智能系统还无法做到对场景的常识理解；
我们不太可能看到所谓的“超级人类AI”。

抛弃那些外界的宣传，我们需要实际且准确地理解人工智能。我们来讲，目前的人工智能有哪些可能性，以及，哪些技术还没有实现的可能。

1. 计算机视觉

可能：在可视场景中标记对象
目前尚无可能：对视觉场景的常识理解

比如，一个会议室的摄像机，把它连接到电脑上后，让它区分哪些是人脸。在目前，人工智能也许可以标记对象，但却不能理解这个场景。

作为人类，我知道这个会议室有很多人，出口在哪里，我要小心台阶不能掉下去。这是我的常识性理解，但计算机是做不到的。

2. 语音识别

可能：多语种语音到文本和文本到语音的转换
目前尚无可能：对听觉场景的常识理解

我的声音可以通过话筒接到电脑中并转化为文本，转化为语音。但如上所述，电脑并不能对文本背后的常识进行理解。

人们可以马上理解一个很复杂的句子来预测下一步行动，但计算机做不到。

3. 自然语言处理

可能：最低限度的翻译和问答
目前尚无可能：语义理解、对话

自然语言中有很多东西，机器是做不到的。机器只能死记硬背，却没有办法真正地回答问题。

当你和电脑交流的时候，它可以回答你“中国最大的城市是哪一个”，那是它通过“中国”、“城市”、“最大”这三个关键词，在百度搜索的答案。

但如果你的问题是“中国不在河边的第二大城市是哪一个”，电脑给你的答案一定是对你一点用都没有的。因为在此之前可能从来没有人做过这个问题的相关数据，没有这个问题答案的数据列表。

但在未来的十年，上述被列为“尚无可能”的部分，将至少可实现基本形式。

十年，就技术而言，是一个很长的时间窗口了。事实上有一些技术已经开始出现，只是目前在比较原始初级的阶段而已。

比如自驾车以及自驾式空中出租车，它们还是会出现的。尽管不会是超级智能，但肯定会越来越好。

但请注意，人工智能系统仍然是非常有限的智能系统。我相信，我的AI同事们也会赞同我的观点：我们不太可能看到和人有同等智力的灵活性与创造性的AI系统。

首先，人类每时每刻都在以新的方式思考怎样用新的语言来表述，就像我现在讲的每一句话都是有创造性的，我在讲话中可以不断讲新的内容以及新的理念，使用隐喻、反讽等修辞。

在现实中，AI系统还做不到。AI可以帮你做一些基础工作，比如帮你在网上订一张票，但是它无法和你谈人生。

此外，人类还非常善于做新的抽象推理。

比如，“Blank从上海走到杭州只花了3个小时”。作为人类，你会做很多推理：Blank会移动，而且从上海走到杭州只花了三个小时，它的运动速度一定很快。那么，你会针对Blank问很多问题。

但AI系统就做不到，它需要反复、重复用海量的数据才能得出一个答案。

最后，人非常擅长计划和规划。而AI系统只是擅于捕捉目前的数据，而不可能对未来做出一个长期的、有条不紊的规划。

很多人在讲“超级人类AI”，这类人一定没有在AI领域工作过，他们根本就不知道AI领域中存在的技术问题有多难。

AI系统可以知道世界所有的城市、餐厅、电影院，然而它也只知道这些事实而已。

所以，我不相信所谓的“超级人类AI”，也不相信AI会比人更聪明。

人们觉得AlphaGo很厉害，是因为觉得一般玩围棋的人就很聪明了，那能打败玩围棋的人肯定更聪明。

这是有误解的。人知道怎么还贷款，上什么学校，怎么和同伴做智慧交流，这些事都是AlphaGo做不到的。

其实，AlphaGo只是通过无数对棋盘的模拟，非常机械地、不断重复地复盘，十几亿、几百亿次地进行学习。这背后没有什么创造力，只是无数次的重复工作。

所谓的“智能”，是我们根据参数汇集起来的数据算法，它们只能复制、模仿、模拟人类的行动，而不是真正的智能。说到底，相比我们真实的世界，围棋的复杂程度要低很多，因为真实的世界充满不确定性。

我觉得，有生之年不会出现这个奇点了。

传统的机器人算法不能适应未来

本节要点：

传统单一机器人的算法并不能应用于未来的智能城市构建；
甚至在今天，传统的机器人问题也没有得到很好的解决；
相比过去的工业革命，人工智能带来的事业浪潮将会比过去进程快三倍。

那么，什么是值得大家担心的呢？

我前面讲到，所谓的超人类智能系统，我们是不应该担心的。而正好相反的是，看似智能，实则不够智能的这些系统，却是值得我们警惕的。

很多媒体提到AI的时候，讲到的是视觉、语音的方面。但我们未来涉及到城市规划、推荐系统、医学诊断等，都不再是传统单一机器人的问题。

这是完全不同类型的问题。

一个机器人的某一错误我们是可以控制的。比如，机器人走到舞台边缘，探测到下面将有一个高度落差，它会知道停下来。

但如果是一系列问题呢？又或者，是很多机器人一起呢？

如果大楼发生火灾，这个机器人就不会知道该怎样逃出去。因为，这是一系列的决策，涉及到你从哪里转移到哪里，还需要和其他人的合作。

比如，大家都从同一个逃生通道出逃，就会出现堵塞，那么，就要选择换其他的道路。在这种情况下，机器人是做不到的，这样的算法是非常难的。

如果你用过去传统的机器人研发算法去应用到城市规划建设等领域，就会出现很多无法解决的重大问题：

1. 大规模多重相关决策的错误控制

搜索引擎给你一个错误的推荐建议，如果没有人因此死亡，就不会出现什么大错漏。顶多你会觉得这个搜索引擎不好用，再换一个就完了。

但假设这个推荐是医疗诊断意见呢？如果这个意见出现错误，那真的是会出人命的。而且，我们已经看到这件事情的发生了。

即便是在金融服务领域，一旦出现错误，也可能会引发市场的大动荡。交通也是如此，如果连公交走向都出现问题，就极有可能发生车辆碰撞，整个城市的交通陷入瘫痪。

因此，一旦扩大到这些领域，我们就不能再以传统应用到单一机器人的算法去做这种大规模的事情，必须要有新算法。

但事实上，在这一点上，我们远未达到。目前，我们所沿用的思路都是比较传统或通用的，并没有意识到在这个层级上还需要做很多事情。

2. 如何在竞争环境中共享数据

很多公司手握数据，却不愿与人分享。

假如，有一个黑客找出了新的办法来骗钱，他针对了某一家公司A。那么，A公司就会从这次欺诈当中学到新东西，可以未来避免同样的情况。

但因为当初的攻击只针对了A公司，其他的公司并不知道，因此也就不知道如何改进自己的系统了。

表面上看，A公司只把这个技术掌握在自己手里，让其他人学不到，这好像有点自私。因为，他没有从整个行业的角度去考虑问题。如果这家公司把这个数据分享给所有人，整个行业就可以一起改善这个算法。

但现在大家都不愿分享，其实一方面是技术原因，一方面也是法律的原因。

3. 大规模的云端互动

大家都在谈云计算，所有的东西都在云上，让人们感觉到非常便利。

但这些智能设备，并不是云设备，而是端设备。

事实上，我们未来将要接触的设备，都会是所谓的端设备，它们没有时间将数据上传到云中。如果你和机器人的每一次对话都要上传到云，就会导致速度跟不上。

比如，汽车做智能，“我在这里到底要不要转弯”这样的问题，是不可能每一次都实时和云进行交互的。

因此，要把端设备和云连接起来，还要实时交互，这两者之间是存在极大挑战的，我们现在也不知道该怎么做。

4. 如何实现公平，保证品质、保持多元化

收集大量的数据并没有问题，但这些数据是可能产生偏差的。

比如，你出于某种原因不喜欢某类人而没有把他们纳入你的样本，但以这样的样本去做预测其结果本身就是存在偏差和偏见的。

5. 稳健性和安全性问题

我们在报纸上经常讲到所谓的超级AI，发生了某种革命。

但请记住我今天讲的话：很多技术还远远不能实现，很多问题还有待解决。

比如，无人驾驶车怎样确保在所有气候条件下，在所有的路况前提上，每一台车都可以保证安全驾驶呢？这其实也是一个极大的挑战。

甚至在今天，传统的单一机器人，也仍有很多问题没有解决。

还有失业浪潮。每一次工业革命，都有很多人会因此失去工作。但值得注意的是，过去的失业浪潮是花费三五十年完成的。但接下来，很多工作可能在5-10年内就会被完全取代，这是一个新的趋势，贫富差距也会随之进一步拉大。

并且，人工智能可能会被居心叵测的人滥用。AI本身不存在邪恶与正义，主要还是看它被谁利用。比如，我们现在的网络安全就是一个很严重的问题。

现阶段人工智能的商机

本节要点：

United Masters：用数据分析打造新市场，换取新的商业模式；
Jibo：开放机器人学习的应用平台，聚焦家庭；
蚂蚁金服：应用大数据，连接客户与商户两端。

我想向大家介绍三家公司，我也是这三家公司的科学顾问委员会的委员，因此有更多的信息分享。

1. United Masters

这家公司是专门做音乐作品的。

事实上，音乐市场在几十年前是为几十家大公司所控的，它们会签几个音乐歌手，然后在市场上大规模推广。而作为消费者，你没什么选择，也就那么几个作曲家和歌手。

但你看现在的音乐市场，已经并非仅限于几位少数的歌手了。在网上，有很多音乐人才，他们会在网上播放自己制作的音乐视频，也会有越来越多的人听他们的音乐。这和以前听音乐的人数相比，达到了一个全新的数量级。

问题是，这些歌手没有一个很大的商业市场，在市场上最受欢迎的音乐，一般还是大公司做出来的。

United Masters的目标，就是希望有更多的人从事自己所喜欢的音乐创作，并可以以此为生。

这家公司怎么实现这一目标呢？就是连接数据，用数据分析。

比如一个年轻的音乐人，他写了很好的歌，有几万名死忠粉。但其实他本人并不知道自己有这么多追随者。

谁知道这个数据呢？网站，比如微信。

United Masters就会把这个数据拿过来，告诉这个歌手，你的粉丝有多少，分布在哪里，接下去可以做什么。比如，你可以去粉丝多的地方开演唱会。

而且，这家公司还会告诉你如何针对自己的粉丝去打造一些产品。

比如，有个粉丝要来这个歌手北京的现场演唱会，那么，歌手可以给这个粉丝一个VIP后台通行证，让他可以到后台见面。很多粉丝是很看重这种和偶像亲密接触的机会的。

所以，通过这些数据的汇总，就可以创造出盈利模式。只要有人对这些数据感兴趣，就可以获取这些数据。因此，慢慢地，这家公司的口碑就建立起来了。

这就是非常好的商业模式——通过一个小的数据交换。传统的唱片公司对歌手的抽成要到85%以上，但对于UnitedMasters来说，它只抽10~15%，就打造了这样一个全新的市场。

2. Jibo

这家公司做家庭机器人很多年了。未来10~20年，我们每个人家里可能都会出现一个家庭机器人。

目前，很多人还是把家庭机器人当作玩具，它们在家里走来走去会发出很有意思的声音，但真正时候帮助到人们的生活，现在还是很少。但是，所谓的家庭助手或者家庭秘书，却是不一样的。

Jibo三年前推出了一个机器人，长得很像手机。但是它会跟随你，像眼睛一样看着你，给你拍照片。你可以对它说：Jibo，今天晚上我要在家里开派对，你帮家里的人们拍照片好吗？

Jibo就会给你拍照。它还会跟你说看这儿、看那儿，可以把整个派对的影像资料保留下来。

这听上去是一个很有意思的应用，但要把它打造成一个规模性的应用还是很难。三年后，这家公司终于感觉找到了方向，推出了一款新的家用社交机器人。

这个机器人拥有电子眼睛、耳朵和声音，可以捕捉照片、视频通话，也可以做提醒、订餐、发送邮件等这些辅助工作。它是一个开放式的平台，可以让人们不断开发新的应用。

这和手机上的应用是不同的。手机的应用并非机器学习的应用。但这中机器人的平台应用，会进行适应性的调整，进行自我学习。

而Jibo肯定不是唯一一个往这个的方向努力的公司。

我相信可能在中国、日本也是会对这种机器人非常感兴趣。

3. 蚂蚁金服

蚂蚁金服在中国发展非常迅速，我现在是蚂蚁金服科学智囊团的主席。他们也是中国首家有这么一个科学智囊团的组织，他们希望智囊团可以帮助这家企业把握未来的方向。

这家公司比我所知道的任何一家西方公司成长都要快。

美国还是一个信用卡加现金的社会。尽管美国有一个Paypal，与支付宝有点类似，但是它的规模也不过是支付宝的十分之一，并且也不是所有人都在用。

也许是受益于中国没有信用卡这个产业的束缚，使得支付宝一下子实现了移动支付的巨量增长。蚂蚁金服手握大量的数据，它知道你买了什么，了解很多关于你的个人信息。

它使贷款变得前所未有的容易。这不是表面上你在手机上按一个键说“给我钱”这么简单，其背后蕴含着大量的机器学习。这涉及到机器学习中的“欺诈监测”：如果你很简单地让人们贷到款，很多人是会来骗你的。

总结

人工智能的商业模式，是要创造一个市场，而非一个算法。

传统的推荐，都是针对个人。

但这里的问题是，如果有一家很好的餐厅，它被推荐给很多人，那么大家都跑到这家餐厅去，就需要排长队，人们的体验就会很糟糕，反过来给差评和抱怨。

如此，整个系统就开始崩溃，形成恶性循环。

你必须要去创造一个市场，而非一个简单的算法。

比如，在APP上面，不仅仅是向客户推荐某一家餐厅。除了让客户看到自己附近有什么餐厅之外，你还要让餐厅看到自己今晚可以供应多少食材，我今天接了一场婚宴之后，还剩下多少个散客的位置。

甚至，你可以了解一下旁边的竞争对手餐厅，他们有没有满座。如果旁边满座了，那么对我而言就是一个机会，我可以打折吸引更多的人流到的餐厅。

你要结合客户和商户两端的需求。

这不仅是一个应用的事情。现在很多公司已经着手在研究这方面的工作。当然，这个过程要充分考虑人们不同的喜好和需求，要掌握大量的数据。

登录查看更多

相关内容

Michael I. Jordan

关注 1

Michael I. Jordan ，美国加州大学伯克利分校电子工程与计算机科学系、统计学特聘教授。他在亚利桑那州立大学获得数学硕士学位，并于1985年在加州大学圣地亚哥分校获得认知科学博士学位。他从1988年到1998年是麻省理工学院的教授。他的研究兴趣横跨计算、统计、认知和生物科学。他是2018年国际数学家大会的全体讲师。他在2020年获得了IEEE John von Neumann奖章，在2016年获得了IJCAI研究优秀奖，在2015年获得了David E. Rumelhart奖，在2009年获得了ACM/AAAI Allen Newell奖。他是AAAI、ACM、ASA、CSS、IEEE、IMS、ISBA和SIAM的成员。个人主页：https://people.eecs.berkeley.edu/~jordan/

【CCF计算机视觉专委会】未来5-10年计算机视觉发展趋势，

专知会员服务

104+阅读 · 2020年5月20日

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

中科大-人工智能方向专业课程2020《脑与认知科学导论》

专知会员服务

126+阅读 · 2020年3月4日

从信息社会迈向智能社会—北京大学高文院士、黄铁军教授

专知会员服务

47+阅读 · 2020年2月20日