让每一个人,哪怕他不是机器学习专家,也能够发挥自己的创造性,能够利用这样的平台,利用这样的互联设备生态,来做更多的事情。
在 AI 开放相关的名词术语当中,TensorFlow 也许是大众知名度最高的一个,甚至成为了空气水源一般,在大多数人数字生活中无法或缺又视而不见的必需存在。从中国的视频平台、二手交易社区、英语线上教学,直到东南亚的病虫害防治,太平洋的鱼类保护,甚至是南美雨林的实时监测。
近期,TensorFlow 最新产品总监,Kemal El Moujahid 到访中国,同极客公园在内的技术媒体一起分享了 TensorFlow 的应用成果、未来方向,以及 Google 在 AI 领域的标准原则。
这是 Google 首次在中国正式公布 TensorFlow 2.0 版本。在 TensorFlow 2.0 版本的中国发布中,进一步明确了这枚 Google 开源机器学习平台将在未来集中强化的三个支柱属性,分别是:易于使用,易于掌握;功能强大,确保用户能以非常快的速度训练非常大的模型;扩展性强,可部署在从小型设备到大型服务器的各类设备上。其中对易用性和强化移动端部署能力,是其中被 Moujahid 反复强调的重中之重。
Moujahid 表示,TensorFlow 2.0 移动端部署能力将成为和 5G 技术普及相辅相成的重要技术特征。
在新版 TensorFlow 平台技术特性和Google AI 应用原则的交叉点上,Moujahid 讲述了一个例子:在印度,空气污染问题非常严重,在冬季,其空气质量指数可达到正常值的 4 倍。测量空气质量是解决空气污染问题的第一步,但部署传感器的费用相当昂贵。德里的一群学生想出了一种创新的方法,利用 TensorFlow 实现一个成本低廉的解决方案。他们开发的 AirCognizer 应用程序,利用手机相机拍摄的照片进行实时空气质量评估,只需拍下一张天空的照片,便可得知空气质量指数。
有趣的是,就在几乎同时,我们的注意力就被一款数据隐私条款含混不清的刷脸应用所占据,几乎同时发生的,还有被用于教室内学生面部和动作监控的一则人工智能应用展示。
TensorFlow 全球产品总监 Kemal El Moujahid | Google
以下为 TensorFlow 全球产品总监 Kemal El Moujahid 的访谈纪要,经极客公园编辑整理:
Q:目前 TensorFlow 最大的改进的空间在哪里?最近投入最多的改进方向有哪些?
Moujahid:今天早上,我在演讲当中谈到了 TensorFlow 2.0 这个项目,其中重要的有两点。
一是让 TensorFlow 这样一个平台更加易用,能够让更多人触手可及。我们希望在以后 2.0 的平台中,可以为那些没有接触过机器学习、并不是这方面的专家的开发者提供一个最好的机器学习工具,让他们去解决他们自己生活当中、所处行业当中的实际问题。今天早上我们举的这个例子,就是在新德里,两个小朋友用 TensorFlow 做了一个空气质量监控 App——这就是一个最好的例子。
我们要加大投入的第二个点,是在移动端侧持续发力。因为我们认为移动端是机器学习未来非常重要的一个方向。我们可以看到,随着越来越多的小型移动端设备普及,在 55 亿台移动设备、2500 个微传感器这样的基础上,机器学习的应用场景需求是非常广泛的,所以未来 TensorFlow 2.0 也将会继续关注这一领域,希望能够把机器学习带到更多的端侧。
Q:目前 TensorFlow 的下载量,最新的数据是多少?哪几个行业应用的比例是比较高的?哪些行业会有更大的突破或者进展?
Moujahid:TensorFlow 在全球的下载量已经超过了 4000 万次,全球社区有超过 2000 人对 TensorFlow 的开发做出贡献。当然还有一些其他技术层面上的数字现在没有公布,但是从全球角度来看的话,无论是从下载量,还是从我们整个社区发展的良性循环角度来看的话,我们都取得了非常好的进展。
谈到不同行业应用比例的问题,其实很难划分哪一个行业现在的应用量会比较大,但我可以和大家分享几个让我自己印象深刻、觉得特别兴奋的应用例子。
一个就是在医疗行业,其实我们都知道传统医疗行业,首先是要先对医生做很大资源投入去培养他们,我们才能保证医生的诊断水平。但是,随着机器学习技术的普及,可以通过训练模型,然后把这个训练好的模型放到我们的移动端设备当中,这可以让整个诊断的过程更加高效准确。举个例子,斯坦福大学现在做的一个项目,把机器学习模型放到手机端,然后去检测皮肤癌。
第二种是在环保领域,还是跟我今天早上谈的印度这个空气质量指数监测这个例子有关系的,通过传感器和更多的手机便携式摄像头,可以把机器学习这一应用拓展得更加广泛。比如现在在亚马逊丛林中,你可以拿着摄像头对着一棵树进行拍摄,进而识别这棵树是否属于非法砍伐,还是属于合理的树木砍伐,这也是一个很好的例子。
Q:有没有什么印象深刻的例子是在中国的?
Moujahid:谈到我们在中国的 TensorFlow 应用,有两个例子可以和大家分享。
第一个就是爱奇艺。爱奇艺在视频编辑和分段领域大量地使用 TensorFlow 机器学习技术。在移动端,他们也是利用机器学习,推出了很多很酷炫的功能。
第二个例子就是今天谈到的流利说这个英语学习的 App。通过机器学习,完全改变了整个英语学习的方式和方法。因为它是通过建议模型来给用户提供他所需要的信息,假如说您可能对某些词或句法已经掌握,那就没有必要在学习当中把你懂的东西再展现给你。我认为这也是在改变我们整个教育行业的生态。
Q:我们看到有很多中国的公司,不管是大的科技公司还是创业公司,他们也都在推出自己的机器学习框架,想问一下您对这些中国公司推出的框架是怎么看的?
Moujahid:其实从这个层面来看,我非常乐见整个行业的发展,因为我们现在谈的机器学习,或者 AI 的应用和普及,可能还处在一个比较早期的阶段。即使处在这样一个接受和普及的早期阶段,我们也不要去忘了我们最终的目标,还是希望能够在全球范围内去推广机器学习和 AI,所以我们现在能做的就是提供我们能做到的最好的应用、最好的技术和最好的平台,让整个应用场景的可能性和速度,以及普及的速度越来越快。从全球范围来看,整个行业的发展有利于我们应用的发展。
Q:关于 TensorFlow Federated 的近况,尤其是开源之后的使用状况,有没有一些现在可以看到的趋势?大概有多大比例的用户,更倾向于选择在本地做学习和计算等?
Moujahid:关于 TensorFlow Federated 系统开源之后,它具体的应用数据和变化,我今天还没有。但是我可以和大家分享的是,其实我已经看到了,大家对这个系统的兴趣度非常高,因为这个技术的核心优势在于,很多个人化开发中,隐私数据没有必要再去上传到服务器和云端,所以完全可以在本地的设备就可以做一个分析和存储。另外,我们刚才也谈到了,移动端这一块的应用将会是 TensorFlow 未来很关键的发展方向,所以这也是为什么说我们现在也看到 TensorFlow Federated 有很大的潜力。
Q:像 5G 这样的最新技术发展,会对 TensorFlow 的进化产生什么影响?
Moujahid:对,像 5G 这样的新技术,的确对机器学习、包括 TensorFlow 的发展,会产生很大的影响。但是我认为 5G 无法解决所有的互联和使用方面的问题。像 TensorFlow 一些低延迟方面的优势,是对这类新技术很好的补充。因为,我们其实想传达的一个最重要的信息点就在于希望我们能够借助 5G 的环境,在所有传感器互联的情况下,让每一个人,哪怕他不是机器学习专家,也能够发挥自己的创造性,能够利用这样的平台,利用这样的互联设备生态,来做更多的事情。
图片来源 Google