大咖 | 卡耐基梅隆教授Tom Mitchell：人工智能在中国前景光明，有2点要注意

2018 年 4 月 27 日 大数据文摘 文摘菌

大数据文摘作品

今天是GMIC大会第二天，文摘菌给大家带来了卡内基梅隆大学Tom Mitchell教授的主题演讲。

Tom Mitchell是AI经典教材《机器学习》的作者（他97年就出版这本书啦），也是CMU计算机学院机器学习系的发起人。

他非常关注中国的AI发展近况，并将中国和美国称作“两大最活跃的AI经济体”。他说，中国的优势在于两方面：数据量和政策。数据量就不用说了，人口摆在那里。政策方面，他具体说到要注意两点：数据标准化和数据源整合。

数据标准化和数据源整合如何造福社会？他举了两个医疗相关的例子：一方面，从不同医院得到的电子病历有不同的格式，如果有政府的参与，将有可能制定统一的标准存储格式，更有利于进一步的数据分析。另一方面，政府能做一些企业不会去做的、不盈利的事，比如从运营商、手机厂商、医院收集数据并整合。这样一来，如果一个患了非常严重的传染疾病的人入院，前几天定位在病人附近的人会自动收到提醒“昨天你接触了一个传染病人，请你留意这些患病征兆”。

以下是大数据文摘整理的演讲精华：

这应该是我在过去三年中第六次到访中国。我看到大家做了很多工作，中国也在人工智能方面取得了巨大的成就。人工智能在中国有非常光明的前景。

我研究人工智能很多年了。人们现在经常问我：人工智能是不是已经过度发展、过度繁荣？事实上，人工智能有很多的类型，在一些领域已经取得了一些进展，这些技术进步未来会改变社会的发展方向。所以现在我们应该回顾过去，展望未来。

在过去的十年当中，人工智能确实取得了很多进展和成果。比如说在计算机视觉发展方面，计算机性能在十年之前不是太好，就连对简单图片当中的物体，它的识别能力也不是很高。但是现在，在物体识别方面，计算机的性能已经提高了很多。当然计算机还没有达到完美的程度，可是它们在十年前还是个“盲人”。它们现在已经能够观察到物体，并且能够识别到物体了。

十年前我们不能用计算机的算法帮助人们把语音转换成文本，但是现在可以了。现在计算机的精确度基本上已经和人类相媲美了。尤其是在机器人方面已经取得了很大的成果，像无人驾驶。我相信在其他的领域，包括医疗、无人机，我们也看到都取得了类似的成果。

中国在游戏方面也已经取得了很好的成果，例如在过去几年中人工智能在象棋游戏中的应用。而且在其他有关识别的方面，计算机也实现了零的突破，就像原来的计算机盲人现在能够看到和听到了。在游戏不同的领域，他们要求计算机有更多分析性的算法能力，而这些领域也是计算机所能胜任的。

大家会问我一个问题，这是不是一个巧合呢？在这些领域人工智能取得的成果是否只是一项巧合呢？不是的。因为我相信对于计算机来说，它有了机器学习能力，并且在物体识别、游戏等方面都取得了进步，原因在于人工智能的开发者改变了自己的策略。他们并不仅仅通过编写计算机的程序，使得计算机能够识别物体，而是对它进行训练，教育机器进行自我学习。比如说这个桌子上有一个香蕉，还有几杯茶，或者在这幅图上有汽车和树，通过这些学习和算法对图像进行分析。

AI将如何融入产业应用

接下来，人工智能有什么样的发展？我觉得在我的头脑当中，会看到人工智能的使用不断的提升，尤其是在机器学习领域，我们会看到出现更多的应用。比如说我们要训练系统进行机器学习，它会出现海量的数据，以及高质量的数据。在过去的几年当中，我们看到有很多初创企业不断的蓬勃发展，在获取了某种类型的数据之后，他们开发了自己人工智能的系统。接下来我们会看到机器学习会出现一些新的方向。

现在你能和自己的手机进行简单的会话。你会问它外面的气温多少，手机会回答我们。我相信在接下来的几年当中，手机对我们的理解会更加深刻。

还有一个领域，其实也是我自己进行很多研究的领域，是会话的系统。在系统当中，使用者在使用会话的时候，不仅仅包括气温是怎么样的、能不能订票这些简单的问题。而这种会话实际上是让你自己教会自己的手机，让它为你提供更好的服务。例如，我住的地方，有的时候它会下雪，我会告诉我的手机如果下雪，就要提前叫醒我，这样我上班就不会迟到了，我会教会它一些新的内容。之后我会教它你怎么发现外面下雪呢？我告诉它你打开自己的网络感受一下外面的气温，察觉到外面下雪的话，之后手机会提前叫醒我。

通过这样的互动，我相信在未来我们会看到一种新的方式，使得我们和人工智能进行更好的交互。

我们在人工智能方面已经取得的成果，有什么样的含义呢？大家知道机器学习使得我们造就了现在辉煌的成果，我们希望能够对一些决策进行优化，对于我们决策的输入和输出，都是线上提供的。我觉得有很多种，比如说我之前提到了会话型人工智能系统，在这个领域我们可以看到一些新的产品和服务。我之前也提到了，有一些能够和我们进行简单会话的系统，像阿里巴巴的智能产品，比如说我要泊车，如果听到声音，它就知道怎么去做。所以大家可以了解到，我们今后要构建出基于交互的一些产品，是基于我们所提供的教学和指令产生的。

另外，我们也看到现在我们手机硬件的成本不断下降，这样手机的造价就下降了。甚至于大家可以在任何一个灯泡上装上相应的硬件设施。大家来假设一下，如果一个灯泡安装在医院的病床旁边，通过灯泡上的传感器，灯泡能够识别病房当中的病人或者是医生、机器，它可以自动连接互联网，也可以来跟踪病人的病历，来了解病人要接受什么样的治疗方案。它也可以检查护士对病人用的药是不是正确的、检测病人是不是吃了医生开的药。

进一步的措施是，我们可以大量的生产灯泡，构成人工智能的系统。一旦我们这样部署，灯泡可以通过不同的方法来进行自我学习。当然这只是一个例子，能够给大家展示出未来我们能够发展的方向，而且能够找到一些新的产品。

AI创造新的商业模式

当然我们也可以开发一些新的商业模式。要使得机器学习有效的话，我们需要获取数据。在美国要创建一家公司，他们就必须提出一种新的商业模式。如果有人给你发信息，比如说帮助你安排会议，他们会启动相应的系统。开始的时候，他们有很多人在做相应的服务，但是他们的商业计划是这样的，他们希望利用这样的工作流来获取世界上最大的训练数据，并且展示如何与人进行沟通和互动，最终会让所有的会议都自动化。

“数据是新的石油、AI是新的电力”，要建立你的业务模式的话，首先你必须有一个系统，来收集世界上某一种类型的数据。

我们也可以看到AI影响下其他的商业模式，比如说像滴滴，就是一种新的业务模式，十年前这种业务模式根本不存在，但是有了AI的话它可以生存。它实际上是非常复杂的AI算法，可以让司机和乘客很好的匹配在一起，而且可以定位司机和乘客的位置，不需要花太长的时间就可以让司机找到乘客。它也可以非常好的来匹配订单到底给哪一个司机，并且让司机尽快接驾。

当然还有其他AI的应用出现了，新的产品和新的业务模式都是由AI带来的，它给我们的社会带来了很多的意义和变化。我们有很多机会用AI来提高我们的生活质量，比如说现在我们可以有无人驾驶，这样的话可以减少死亡，同时可以减少污染。另外，也可以减少交通阻碍，也可以用于提高效率。

也可以用来提高教育的质量，比如说用AI的方法来建立定制化的教育项目，满足各个学生的需求，并且根据学生的情况进行建模。比如说他们已知的知识是什么，为他们设定相应的问题，对学生进行诊断，更好的了解学生的情况是什么，对学生进行一个定制化的针对性的教育。

也可以看到，我们有很多传感器或者是效果器，这样可以对城市进行自动的监管，也可以进行自动的报告，例如，可以告诉用户在哪里有比较好的停车场。

当然也有很多的挑战，比如说关于无人驾驶的有效性，比如说在一些极端情况下，无人车是不是会撞到树上或者说会不会撞上人等等，这是我们在驾驶无人汽车会面临的问题。我们把它放到计算机当中，它会变成道德问题。

AI：中国的巨大机会

中国的人工智能发展非常快。坦诚来讲，AI方面中国和美国是世界上最活跃的两个经济体，在这两个国家有很多AI的体验。我认为中国在AI方面的机会是非常独特的。中国比世界任何其他国家都有一个更好的机会，可以向世界其他地方展示如何把人工智能用于改善人们的生活质量。

首先因为中国的数据规模巨大。另外，中国的文化、政府愿意支持产业。中国对于隐私方面的态度也在发生变化。我觉得中国在人工智能方面有非常大的机会，我们可以展示如何利用大数据让社会受益。

政府会做一些私人企业根本不会考虑的事情，因为对私人企业来说，有些业务利润是很低的。但这些工作是对于社会却是好的，这是政府需要做的。

举一个医疗数据的收集的例子。在过去一年里，我访问过中国两次，有人找到我，他说你是做机器学习的，你能不能帮助我，我有一亿条医疗数据，你能不能帮助我怎么样更好的使用这些医疗数据。这是我在别的地方都没见过的情景。

现在确实依然还有一些问题有待我们去解决，比如说，我们从不同医院收集的数据，他们的格式都是不一样的。你需要把这些数据标准化，把它们形成一个单一的数据集才能使用。

政府可以设定数据表示的标准，这样所有的医院都会使用同样数据结构，这样不同医院的数据就可以整合在一起了。我觉得这是中国的优势，中国可以做到，不仅仅是因为中国的数据量非常大，也因为有这样的结构，可以让我们建立一些数据标准。这一点是非常重要的。因为只有这样的话，才可以从数据当中提取相应的价值。

第二个例子，报纸上经常报道可怕的传染疾病。今天有了数据和AI体系之后，我们可以更好的来应对传染疾病。比如说我们可以把线上或者媒体已有的地理定位数据和急诊室结合在一起，比如昨天你在一个公共场所，另一个昨天也在那的人患了传染病去就诊了，你就会接收到一条提醒信息说你接触过一个传人病人、患病几率较高、如果出现症状需要及时就医。这对社会非常有益。我们需要不同的机构参与，我们需要从不同的机构收集数据，以一种特殊的方式把数据整合到一起使用，这样才可以提高生活质量。