IBM决定向中国企业开放芯片技术时,她组建了云平台团队全力支持

2018 年 5 月 24 日 InfoQ

记录与时代并行的技术人,暌违已久的二叉树短视频回来了!叩问过技术大牛的「初心」,描绘过技术人的「众生相」,这次我们带您去见识那些横跨「两界之间」的技术人们。这是 10 位行走在中国人工智能之路上的技术人,他们正见证着中国的人工智能技术落地。点击公众号菜单「戳」一栏“二叉树视频”或扫描文末二维码可观看往期高清视频。


《两界之间》技术专题纪录片 | 第六集

由 InfoQ 二叉树 出品

嘉宾简介

林咏华,IBM 全球技术研究院成员,IBM 研究院 AI 系统全球研究负责人,技术总监。她在 IBM 研究院从事了 15 年的系统架构、云计算、认知计算平台等领域的研究。她本人有超过 50 个全球专利,多篇学术文章发表在顶级国际会议和杂志。与此同时,她热心推动科技界多元化文化的发展,她目前还担任了 IEEE Women in Engineering 北京的主席。

Q:首先请您回顾一下过去的经历,有哪些重要的事情是您觉得印象特别深刻的?


加入 IBM 已经 15 年,最开始的五年我是做 IT 和通信领域的跨界创新。当时是利用 IT 基础架构来支持无线网络通讯。在那几年,我们帮助整个业界开拓了一个新的潮流:把传统无线领域的专用设备用软件定义的方式运行到云平台上面。当时我们成为无线网络云 (Wireless Network Cloud)。后来跟中国移动等更多的企业合作创新,第一次用虚拟化云平台支持了 2G, 3G 和 4G 的无线网络。

很自然的,我的第二个阶段就进入了云计算,也是对我来说是印象最深刻的。我们构建了一个叫 Supervessel 的“超能云”,成为全球首个支持 POWER/OpenPOWER 架构的开放云平台。IBM 一直有很强的基于 POWER 架构的处理器技术。从 2013 年开始,当时为了推动整个业界更加开放的合作,IBM 联合 Google、Redhat 等企业提出了 OpenPOWER 联盟,把这个芯片技术开放给全球企业,也包括中国政府和企业。但当时面临的最大困境是,所有的公有云上面的服务器都是 x86 的架构。

如果整个业界没有基于 POWER 架构的云,那哪怕提出 OpenPOWER,更开放的去跟企业合作,还是有巨大的挑战。例如,一种不一样的 CPU 架构,能不能提供云服务、能不能支持大数据、甚至未来的计算技术等。当时,商业的云平台提供商都不敢贸然去试。

而在那个时候,OpenPOWER 最活跃的地区是在中国。IBM 跟中国企业达成重要合作,把OpenPOWER芯片技术开放给企业,帮助中国去打造自己的通用处理器,我觉得在那个时候是很具有历史意义的。我自己当时在研究院就是负责系统和云计算技术的,所以在一种使命感的驱动下,我带领团队在北京构建了 Supervessel 云,第一个支持 OpenPOWER 的云平台,免费开放给开发者、高校和 OpenPOWER 的联盟企业。

这个云平台本身是研究院团队利用自己的 part time 打造和运维的。有超过了 1 万多的注册用户,每天有大概 2000 多活跃在这个云上。我们用自己的一些些努力,证明了这种非 x86 架构去支持云计算、大数据等是没有任何问题的。当时我们在这个云平台上也做了很多的重要创新,包括全球首次 GPU 在容器云上提供服务,首次在云上面提供 FPGA 虚拟化的服务,首次在容器云上提供深度学习开发服务等。

Q:回忆一下您第一次接触计算机技术的经历?

我觉得我是比较幸运的。相对于我的同龄人来说,很早就接触计算机。我上小学是 1983 年,第一次接触计算机大概是 1988 年,当时接触的计算机是苹果,学的是 logo 语言。那是我第一次接触计算机,自此就让我对这个东西很感兴趣。

正因为感兴趣,所以母亲在我初二那年,大概 1991 年左右,给我买了一台 286 的兼容机,我记得是 3000 块钱,母亲一个月的工资才几百块钱。当时我们班里只有我有计算机,所以我觉得很幸运,母亲愿意为我的爱好做这么大的投资。

当时并没有像现在这么多比赛,因为大家都没有计算机,何来比赛?也没有也没有培训班。所以当时我真的是自己喜欢,买了很多电脑报,计算机报,买回来之后就按照上面给的一些攻略去 hack 这个计算机,让它可以做更多的事情。在这个过程中有两点我觉得是很有意思的。一个是到了高中,已经有了真彩的显示器,有显卡。我也能在计算机上去玩大富翁、大航海时代等等。但是我玩游戏很没有耐心,所以就去 hack 内存,很快的就打通关,所以导致我后来对游戏就不感兴趣。

另一件对我帮助比较大的事情是帮我母亲开发财务软件。我母亲是做财务的,那个年代都是每个月用手抄工资条来发工资,工作量很大。为了减轻母亲的负担,我高中的时候基于 Foxbase 开发了一套财务软件。我妈妈可以在软件里面输入他们单位的信息,管理单位每个月的工资发放。为此我母亲还专门买了一台 Epson 的针式的打印机。当时对我们这个家庭情况来说,买一台这样的打印机,别人都觉得很不可思议,但我母亲觉得只要我能学到东西,这些投入她都愿意去做。这就是我接触计算机的经历。

那时候很多人进大学时都还没有机会接触计算机。我大学本科不是读 computer science 的,但是正因为有这段经历,我在某些方面的确比别人的起点要高。

Q:您如何评价自己的性格?

我不是那种随遇而安的性格。每一次当我心里头有一个东西特别想做,而这个东西有可能跟现在的 rule 是不一样的时候,我也会 break 那个 rule 去做到。

例如最开始做 wireless network cloud(无线网络云),我们想做的是用普通的服务器就可以替代移动通信里面基站的专用设备。运营商很认可这个新的思路,但这跟当时大多数设备商的利益是冲突的。但是我觉得这是 CPU 多核架构、云计算技术发展到那个阶段的必然趋势,是很重要的未来。所以我当时就不断地去联合一些重要的厂商一起去完善这个想法,最后我们一起在 ITU、巴塞罗那全球通信展都展示了重要的技术原型,为后来 C-RAN 在业界的成功打下了基石。

又例如 Supervessel Cloud,当时公司内部也有质疑的声音,为什么要另外做一个云平台技术。但是我觉得这是我们作为系统研究团队的使命。我们需要先迈出这一步,通过创新云的方式去试验,以可试错的胆量来支持最先进的系统技术。否则,许多先进的系统技术只能够等很长时间才能够有机会被用到商业云里面,而导致技术发展的生命力被白白耽搁了。如今我带领团队做 AI 系统也是这种情况。

所以,在我自己的性格里头:总是有一些很重要的声音告诉自己,什么东西很重要,我该去做,去突破自己。

Q:您好像不怕冲突?因为您知道,尤其中国,尤其是女性,容易觉得和稀泥、你好我好大家好这样比较好。您如何能够有勇气去挑起这种冲突?

这或许是 IBM 的一个特殊性。IBM 会给予女性的技术员工很大的空间,鼓励她们说出自己想说的话,鼓励她们成长。IBM 也因此这么多年都被评为了女性技术工作者最希望去的公司。

Q:您什么时候开始觉得自己是个 AI 圈子里的人?

其实我时到今日,我还是觉得我自己其实是一个跨界的人。最开始应该是 2015 年,在 Supervessel 云上面支持了 GPU、FPGA 等加速器服务,随之我们就在 Supervessel 上启动了一批深度学习的服务,包括支持深度学习加速运算的服务。

如果是比较狭窄的把 AI 框定在深度学习、人工智能的算法,的确那些不是我自己的强项,虽然我也每天关注、探讨和使用。但是如果我们认为整个 AI 的领域实际上是涵盖了系统的创新,涵盖了在云计算上的创新,涵盖了算法的创新,甚至涵盖了应用和落地的创新的话,那我觉得我是这个圈子里面的人。时至今日,IBM 第一套用于企业的计算机视觉 AI 开发平台,是3年前,我带领团队从无到有做出来的,目前已经在全球不同行业推广。而今天,面对充满挑战的人工智能产业落地,我提出的技术路线是 AI for AI。所以,从这个方面来说,我还真是这个圈子里的人。

Q:那如果按照您刚才的说法,系统的创新,云计算的创新,算法的创新,应用的创新,这四个领域在去年这一两年有什么东西是进展比较大的?

在计算机视觉领域,已经从之前的物体类识别、分类或跟踪,发展到动作类别的检测 (Action Recognition)。人工智能还是要帮助商业和业务回答发生了什么事情,而并不只只仅仅是说检测了这里有个人或有个什么物体。因此,需要我们通过人类动作的分析,再加上周围环境的辨识,去深入理解业务逻辑。

在这里我关注两点。第一,我们认为对于人的动作的理解,并不是仅仅一个单独的动作,而是在一连串的动作之后,机器能知道这个人在干什么,或知道这一群人在干什么。这是人工智能越来越靠近商业应用,真真正正能帮助商业应用很重要的一步。去年,业界在这方面有更多的突破。有更多的数据集被公开出来,也包括 IBM 公开的数据集;还有好些团队在这上面做出的成绩,我觉得都是比较重要的。

另外一个是我关注的是系统方面。对于 IBM 来说,我们认为整个 AI 系统的生态是很重要的。无论是数据中心还是物联网,无论是在车里头的还是挂在电线杆上的,还是部署在生产线上,承载 AI 运算的硬件形态是很多样的。IBM 在硬件上主要关注的是数据中心服务器,但是我们不会把所有的硬件都全部做,因为这是一个很大的生态。但是我希望 IBM 在人工智能上面,无论是软件、技术和方案,我们可以帮行业企业对接不同的硬件,不同架构的芯片,包括是说像传统的 GPU、FPGA,甚至是新一代的人工智能芯片。这是我们目前正在努力的方向。

所以从去年到今年,我拜访了好些人工智能芯片的厂商。在去年早些时候,大家更多的是 PPT 上讲技术。但到了今年,相当一批公司已经有了 AI 芯片的原型,明年年初就能量产。而且在这里我也很高兴看到,这些厂商中,包括好些在硅谷的,要么创始人或者重要的领导者都是咱们华人。华人在这个领域里面的确已经成为了很重要的力量。

Q:提到人才培养,您对这方面有什么经验分享?

首先,典型的 AI 人才的确是缺乏。年初 LinkedIn 的白皮书统计每年全球有多少的 AI 人才培养出来。它统计全球 300 多所有 AI 培养能力的高校,每年全球毕业的硕士加博士生,大概只有2万人。

在那 300 所多所学校里头,中国的高校列在里面的只有 22 所,当然我们未必需要同意 LinkedIn 这个数字。但是如果就是这样一个数量级的话,其实对于国内来说,可能每年毕业的硕士加博士生在 AI 领域顶多就是几千这个数量级。目前,医疗、能源、交通,教育、零售、制造等行业都希望把人工智能进行产业化落地。在国家统计局的统计中,每一个行业里国内的注册的企业是上万、几十万、上百万的数量级。所以我看到了很大的一个人才差距。国家政策鼓励高校建立相关专业的培养,我是完全同意的。

另外一个方面,那是否意味着很多传统学科不重要呢?我觉得完全不是。我觉得学习机器学习,就像我们现在看计算机教学。在过去十年或 20 年,因为计算机的兴起,所以出来了一批 computer science 的学科。但今天所有其他非计算机的学科,也在学习如何用计算机,因为对他们来说已经成了一个必然的工具了。只是计算机学科本身的人才,会更深入地去了解操作系统、编译器等的技术。

因此,类似于机器学习这种科目,我觉得大多数的传统学科都应该开设。每一个行业的专业知识都很深。只有当行业专家自己本身接触过 AI 的一些基本知识,他们才能更准确的挖掘如何把 AI 用于解决本行业的问题。如果完全依赖专业外面的力量去解决,那是隔靴搔痒。

Q:最后一个问题。您期待自己在这个行业乃至这个时代发挥怎样的作用?

两个方面。第一个方面,我希望真正可以帮助到更多的企业。我的梦想是有一天这个我们的 AI 技术搁到企业那儿,实际上是根本不需要像我们这种 data scientist 在身边。这是我目前主要专注的 AI for AI 的技术方向,我相信它是我们的未来。

第二方面,跟企业已经没关系了。我希望可以把 AI 这一种新的、未来可能影响我们几十年甚至上百年这样子的知识,从今天开始可以帮助我们的孩子、青少年萌芽。我今天对 computer science 这么感兴趣,到了今天我还很愿意去做很多 coding 的工作,是跟我小时候就有机会去接触那些知识密切相关的。所以我希望可以尽自己的微薄之力去帮助他们,让更多孩子有机会走进这扇门。


真爱粉福利

感谢图灵教育赞助,本次小程序抽奖送出 5本《DevOps实践指南》(点击下图即可参与抽奖)


畅销全球 50 多万册的 IT 小说《凤凰项目》姊妹篇;DevOps 实践第一书;IT 组织效能专家 Gene Kim、持续交付先锋 Jez Humble、DevOps 之父 Patrick Debios、DevOps 布道师 John Willis 联合执笔;国内 DevOps 一线人士精心翻译,众多业内专家联合推荐;为现代企业数字化转型提供从启动到实现所必需的理论、原则和实践案例;EXIN 国际信息科学考试学会 DevOps Professional 认证指定教材。

全书涵盖 40 余个 DevOps 案例,以谷歌、亚马逊、Facebook 等全球知名企业和组织的实际调查结果为依据,展示如何通过现代化的运维管理提升管理效率,进而为企业赢得更大市场、创造更多利润。

登录查看更多
0

相关内容

华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
DevOps 国际峰会 2019 · 北京站完整实录(附PPT)
DevOps时代
52+阅读 · 2019年7月8日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Arxiv
12+阅读 · 2018年9月5日
VIP会员
相关VIP内容
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
Top
微信扫码咨询专知VIP会员