摘要:TensorFlow 能输出谷歌的 AI 服务,并且帮助谷歌再完成一次「生态建立」的使命么?这对正走向 AI first 的 Google,将是一个关键问题。
在谷歌位于硅谷的园区里,一座被命名为 1965 的低矮的办公楼坐落在离 101 高速路出口最近的区域。单从地图上看,想驱车前往这座不起眼的建筑并不方便。过去几十年里,每天穿梭在这条高速上的山景城居民早已经对硅谷发生的那些「改变世界」的公司和产品故事习以为常,这座矮楼当然也常常被习惯性的忽略。
但这里是谷歌大脑的所在地。现在,当人们对未来充满恐惧、谈论起人工智能是否会取代人类、机器和人的关系该是如何时,至少该先看看发生在这里的近况——作为当下一轮机器学习和神经网络热潮的第一批拥趸,谷歌大脑已经取得了一些标志性的成就。
谷歌正在围绕着 AI 重建公司,机器学习现在则成为了这家巨头包括广告、无人驾驶等重要项目的主要技术驱动力。而无论从谷歌一贯打造开放平台的「传统」来说,还是从商业化上的考量,将机器学习的成果开放给更多开发者,几乎和用这些成果改造自家产品是同样重要的问题——这一步决定了谷歌能不能在这个近乎处于蛮荒状态的 AI 时代尽早建立生态。从一定程度上来说,2015 年谷歌发布的机器学习开发平台 TensorFlow 担负了这样的使命。
2015 年,在将 TensorFlow 正式开源时,Google CEO Sundar Pichai 曾经在公开 blog 里写到:「我们内部已经看到这个工具能够提供非常强的能力,并且希望把机器学习的能力开放给更多的企业和个人开发者。」两年后,TensorFlow 已经成为 GitHub 上最受开发者欢迎的工具。远超由微软、Facebook 等公司提供的计算框架。
谷歌大脑的工程师们很愿意把 TensorFlow 的故事与安卓的诞生和意义做类比,并且津津乐道。后者是帮助 Google 完成桌面时代向移动时代转型的关键一跃。
TensorFlow 能输出谷歌的 AI 服务,并且帮助谷歌再完成一次「生态建立」的使命么?
这对正走向 AI first 的 Google,将是一个关键问题。
TensorFlow 的诞生和开源的过程,既符合 Google 一贯坚持开源、消除信息死角的传统和使命,又代表着这家公司在下一个十年的野心。
2011 年,四位 Google Fellow 之一、MapReduce 和 BigTable 的发明者 Jeff Dean 和当时的斯坦福计算机科学家吴恩达共同创办了 Google Brain,专注于用神经网络的方法研究人工智能。一年之后,这个最初建立在 Google X 中的项目脱颖而出,成为更高一个层级的研究机构。
Google Brain的领军人物Jeff Dean,他曾经发明 MapReduce 和 BigTable
在 Google Brain,每一个工程师都能对这个部门的使命脱口而出:让机器更智能,以提升人类生活质量。利用深度学习技术,计算机将一定程度上模拟人类大脑神经元的工作模式,建立学习机制。这也意味着这项技术发展到一定程度上,人们不再需要依据规则的系统进行人工智能在各个领域的开发,机器也不再需要提取语音、文字、图像等各个领域的特征,它可以自己通过训练达到目标。
而就是在基于神经网络的深度学习开发过程中,研发团队开发了一个名为 DistBelief 的深度学习技术框架,这个名称是「disbelieve"的谐音,代表着这是一个在技术和潜力上都「简直不可思议」的计算框架。但当时的 DistBelief 要在 16000 台计算机的计算基础上才能运行,过程非常复杂。Google Brain 团队对这个框架进行了简化,让它变得非常灵活,能够轻松运行在个人计算机或者单个或多个 CPU 和 GPU,甚至移动设备上——这成为了如今我们所熟知的 TensorFlow。
在 2015 年,Google 正式开源了 TensorFlow。这是擅长从事长期研究的 Google Brain 成立几年以来,唯一一个对外发布的产品。事实上,最初发布的版本也并不完美。但 Google 的工程师们显然有着更长远的考虑。
一方面,Google Brain 团队在最近几年已经强烈意识到,有时产品落地比发表更多的论文更加重要。更何况,Google 曾经也经历过「为他人做嫁衣」的教训。2003 年,Google 公布了关于 GFS、MapReduce 和 BigTable 三篇技术论文,它们成为云计算发展的「三驾马车」,Google 内部曾经为此欢欣鼓舞。但几年后,MapReduce 则由 Apache 基金会率先开发成分布式系统的基础构架 Hadoop,并开给外界使用并且获得广泛应用,自那以后,在开发者的认知中,Hadoop 竟然成为了 MapReduce 的「发明者」。
此事曾让 Google 的工程师们十分受挫。所以这一次,Google Brain 不再只把相关成果以论文方式发表在学术起开上,同时决定把相关源代码以 TensorFlow 的方式「一步到位」的开放给工业界。
另一方面,尽管 TensorFlow 本身没有任何商业盈利的计划,但它可以成为 Google Cloud 在商业推广上的重要推动力。在 2015 年,在开源 TensorFlow 以后,Google 很快公布了 GoogleCloud ML 服务。这意味着,基于 TensorFlow 生态链的、服务多个大规模计算领域的神经网络(比如 Alpha Go)就会成为 Google cloud 推行「AI 即服务」的杀手锏。
或许就是来源于技术方面的自信,Google 云平台业务的负责人黛安·格林在今年曾经非常乐观的预测,因为有来自人工智能方面的加持,Google cloud 的市场份额将在五年后跃居市场第一。
就连在 GoogleBrain 工作的工程师都认为,从路径和目标来看,TensorFlow 的开源有着安卓生态故事的影子。
在 Google,一直都有着非常浓厚的开源基因。目前它旗下已经有超过 60 个开源的项目。开源甚至成为了这家公司商业模式的重要组成部分,而安卓的成功让它对这一点更加认同。
进入移动互联网时代后,Google 在 iPhone 大卖后立刻加速了安卓的发布,并且在接下来的时间里不断更新版本,让这个系统在低价手机和高端手机上都能实现完好的适配。这一步基本帮助不擅长硬件的 Google 完成了移动优先的战略转型,防御甚至反击了苹果 iOS 在移动时代的强势进攻。到现在,安卓已然成为 Google 的一个标准平台。
时至今日,Android 身影几乎无所不在。但安卓系统的演进也经历了先求有、再求优的过程。而也正是因为开源,才让谷歌吸引了大量第三方合作伙伴和人才的参与,才建立起了在移动时代的生态系统。
安卓生态的成功,让Google更加相信开源的力量
Google 一直坚信,能够获得用户的信息和长效依赖,这比用户一时的消费有价值多了。所以在 Google 喊出 AI first 的口号后,开源一个促进机器学习研究和企业应用产品对接的平台,意义不言自明:它有望帮助 Google 构建机器学习领域的产业标准,也能大大降低深度学习在各个行业中的应用难度。使用 TensorFlow 进进行机器学习领域的研究和应用的人越多,就越容易让谷歌在人工智能领域获的主导权。
但结合软件和硬件等方式将 AI 能力开放并输出,这已经是属于科技巨头的兵家必争之地。包括微软、百度和 Facebook 都开放了提供基础路线图的深度学习工具,甚至在 9 月 11 日,Facebook 和微软决定联手开发一个允许人工智能开发者在 Caffe2、Cognitive Toolkit 和 PyTorch 框架下自由互通的格式,该项目被称为 ONNX。
这一步棋,被人们视为 Facebook 和微软两家巨头联手对抗 TensorFlow 而为之。
但单从人工智能服务的输出布局上来看,Google 几乎完全不用担心:在深度学习的生态方面,Google 结合从云到 TPU 再到 TensorFlow 的整体服务矩阵的组合逻辑似乎已经更加完整:TensorFlow 的基础框架和 TPU 的计算能力现在都可以通过 Google cloud 向外输出;在这背后,则是 Google Brain 一刻也不会停歇的基础研究和正在研发中的量子计算。
如果人们曾经认为软件会吞噬世界,那么现在,Google 有了更大的胃口。从这个角度上来说,TensorFlow 和它背后这套 Google 的人工智能「组合拳」,似乎在为一个比移动时代更有「张力」的未来做准备。
不过,TensorFlow 本质上还是一个比较底层的框架,它更适合大规模的调度,但也因此常常被工业界吐槽不能满足很多个性化需求,导致不少运行在 TensorFlow 上的具体项目在商业化落地过程过于缓慢。
在知乎上,出门问问 NLP 工程师李理就撰文分析过:「TensorFlow 有意义,但又不是神乎其神的东西……因为在工程界里,若要完成一整件事,如识别语音,TensorFlow 这种通用深度学习框架的存在更多是锦上添花,而非决定根本。」
就拿 TensorFlow 和百度推出的深度学习框架 PaddlePaddle 相比来看,后者似乎更加「务实」,它不仅将源代码开放,而且直接为开发者提供了很多整体解决方案,为开发者提供了快速实现商业化落地的路径。对于这个开放社区来说,百度介入的更深,也表现的更加心急。
不过这本质上指向的是一个关键问题:在技术越来越走向开源的今天,国内科技巨头们正在推崇的「AI as a service」是否是个真正成立的商业命题?
越来越多的科技巨头,喊出了「AI 即服务」的口号
例如,目前腾讯云搭建的卷积神经网络模型, 已经可以让开发者利用 TensorFlow 实现基于 CNN 数字识别的代码;而阿里云推出的 GN5i 也可以一键部署 TensorFlow、caffe 等主流深度学习框架,并且在这个基础上对接了更多开发者的具体需求。
选择这些服务当然会让开发者更加「省心」,即便不能满足开发者 100% 的需求,也能让他们在 90% 的基础上继续开发。但另一方面,选择某一家云计算的服务,也就意味着需要在前期与巨头的设备进行绑定。对中小型创业公司来说可以减少成本,但对不少「有野心」的创业公司来说,这算不上是一个简单的决定。
同时,从另一个角度来说,在未来当 AI 成为一种「普惠」、「民主」的基础能力后,出售 AI 服务的商业价值和想象力还有多大?
当我们把这个问题抛给 Google 时,Google 的工程师们坦承的表示,在 Google Brain 内部对这个问题也有过争论。但目前 TensorFlow 依然采取了比较「保守」的战略:提供更多个性化服务当然可以让平台离商业化更近一步,但当下,依然是不断完善这个社区的基础能力,并且期待开发者能为它带来更多突破——更何况,就连 Dean 自己也预言,想要实现通用型人工智能,大概还需要至少 15 到 50 年的时间。
所以目前 TensorFlow 选择只开源代码,并在运营社区时把更多时间花在了和开发者沟通并且教授专业知识的工作上,以便更多的 Google 员工和 Google 外部人员可以帮助到这个社区。
但包括谷歌在内的许多工程师还在向着通用人工智能这个远大的方向进行长时间的研究。而那些利用开放框架运行的项目和大量数据也能反哺和加速这个过程。
目前 Google Brain 已经把机器翻译、图像分析、医疗、机器人等几个领域作为深度学习重点研究的方向,并且寻找通用的解决方案。比如在医疗影像中,深度学习已经可以使用视网膜影像进行糖尿病的诊断。不过张坤也坦言,这些领域或许不是最「火」的,但却在 Google 的能力范围内。Google的工程师向我们表示:「接下来更近要的是看业界将如何利用 Google 开放的这些能力,也许他们会给整个人工智能在解决实际问题的过程中带来惊喜。」
TensorFlow 已经拥有了超过 500 位代码贡献者,从发布至今,一共有超过 12000 次的代码提交和超过 100 万次的代码库下载。「我们很幸运有机会能与这么多的外部开发人员进行互动,希望对其中的一些人产生积极的影响,并且帮助他们创造基于机器学习的新应用程序。」GoogleBrain 的一位工程师颇有自信的说,「现在我们只需要把事情做好,那么很多数据自然会聚集过来。」
那么,TensorFlow 会成为 AI 时代的新安卓系统么?或许从现在 TensorFlow 业务设置的架构和影响力上,我们还很难给出这样的定义。但这个带有些许「公益」性质的开源工具需要依托更多人和数据的参与才能继续延伸能力,它为 Google 未来在 AI 布局上带来的基础优势还是显而易见的。
更何况,跳出业务和商业计划,这个机器学习时代更具有普适性的「工具」体现的,仍然是 Google 坚持多年「持续开放」、「消除信息死角」的价值观,和它最终期待建立的「AI 民主化」未来。
这是极客公园前沿社超频之旅的系列文章之一。今年九月,我们与国内优秀创业公司的管理者一起走进了硅谷,和 Google、Facebook 以及多个前沿科技公司进行了深度交流。现在,我们选择了这趟旅途中最有价值的思考想和你一起分享,请持续关注前沿社和顶楼带来的后续报道。
顶楼 TopView 是极客公园前沿社的特别内容生产小组,我们关注前沿科技对现在及未来商业所带来的影响,发表最具科技的商业洞见。
文章转载自 顶楼TopView