中国AI发展的三十年,从一个独立而贫瘠的孤岛,到如今的学术、应用百花齐放。
而这样的历史进程、如此迅猛的发展,中国的AI是如何做到的呢?
近期,正值哈尔滨工业大学建校百年之际,讲述哈工大知名校友故事的“建校百年•哈工大人”系列丛书陆续上线。
而丛书之一的《AI已来:让中国AI走向世界的王海峰》,便以中国AI领域年轻一代的领军人物、百度首席技术官王海峰,在这一历史进程中的亲身经历,用独特视角讲述了中国AI如何用三十年时间,发展壮大至今。
30年前,中国的AI有多么贫瘠?
别说是AI了,就连电子计算器,在中国大陆的家庭中都是个稀奇物件。
而20世纪80年代初,卡内基•梅隆大学已经为DEC公司制造出了专家系统,包括美国、日本在内的许多国家都投入巨资开发所谓的第五代计算机,当时叫人工智能计算机。
直到20世纪80年代末,才出现了名为“286”的微型台式电脑, 价格却贵得要命,即使是大陆自攒的拼装货,往往也得五六千元。
而当时的工资水平,一位小学教师一个月的工资也只有60 元左右。
但是,中国人追赶现代科技的决心却不可小觑。1984年以后,学电脑迅速在中国大陆成为一种新风尚。
也是从那时起,正在哈尔滨第三中学读高中的王海峰,开始真正接触计算机。他学会了打字、文档处理、Basic编程等基本的电脑操作,为 以后的计算机生涯做好了基础的知识和技能储备。
高二的一场全国物理竞赛中,黑龙江省只有15人进入决赛,王海峰便是其中之一,而决赛场地便设立在哈工大的实验楼。
这一次的比赛经历,让王海峰深刻体会到了哈工大工程师文化传承下来的精神资产——其校训:“规格严格,功夫到家”。
也成了他坚定不移的考取哈尔滨工业大学的原因。
1987至1993年,IBM的个人PC正式问世,苹果开始推广第一代台式机。
当PC开始在发达国家普通家庭中普及的时候,当时人工智能硬件的代表——专为Lisp语言量身打造、能够处理系统函数运算的大型计算机Lisp Machine迅速黯然失色,从先进技术 的代名词变成了人们眼中的“废物”。
于是,政府经费开始收缩,研究项目陆续冻结,多米诺骨牌效应之下,学界迎来了历史上著名的“第二次人工智能寒冬”。
中国的人工智能研究,也是如此。
1989年,怀揣着科学梦想的王海峰进入了哈工大的“89322班”, 89意味着89级,3代表着计算机系,22则代表着硬件二班。在这一串数 字之中,王海峰开始与NLP结缘。
后来王海峰身上所展现的很多特质,其实在哈工大就读期间就已经能找到踪迹。根据几位同窗回忆:
王海峰身上有很多非常“哈工大”的 地方。比如当年学生们在实验室中得以接触到286型号的老式计算机,游戏就成了一种很常见的娱乐方式,相比当时更为流行的格斗、赛车等等有强烈感官刺激的游戏,王海峰更喜欢招兵买马、排列布阵的策略型游戏,享受动脑的乐趣。
又比如他自律到了同窗口中“收放自如”的地步,可能上一秒还在和大家一起笑闹玩耍,下一秒意识到自己需要学习了,就能立刻停下手头的事抄起书本。
大概就是因为这样的个性,和对于AI一直以来的向往,王海峰在大四做毕业设计时来到了时任校党委副书记的李生教授的实验室。
在那里,王海峰以机器翻译为媒介,真正与NLP相遇了。
1993年,在王海峰进入李生教授的实验室时,CEMT系统已经进化到第三代,也早已投入实际应用获得了不少好评。
李生教授交给王海峰的任务,是对CEMT-III进行优化。也就是说,虽然当时在很多人眼中NLP还是遥不可及的镜花水月, 但王海峰所接触的第一个项目,就是完全属于应用性质、真刀真枪直面用户的。
这一点对于王海峰后来的学术研究,包括后来在百度工作,无形中都有着莫大的影响。
在李生教授的认可之下,王海峰开始以CEMT-III为契机推开NLP 宝库的大门,虽然这一领域在当时远不及今天热闹,甚至不被很多人看好。
王海峰参与的另一项任务,是汉英双向机器翻译,又称BT863,是当时“863计划”之一的项目。
当时正在读研究生的王海峰,在BT863的汉译英方向做规则知识库的建构,以及计算机软件等方面的准备。
虽然当时实验室一年的经费只有十几万元,一间二十几平方米的房间密布着几台电脑,但在当时已经属于条件优异了。
王海峰也深知这种 条件得来不易,几乎扎根在实验室里,和师兄弟以及导师一起为BT863 忙得日夜颠倒。
1995年,到了BT863进行最终测评的时候,王海峰取下了装着整个系统的硬盘,小心翼翼地用纸包好,和同学、导师们一起坐上了前往北京的列车。
在测试过程中,哈工大的BT863在汉译英部分获得了全国第一。当时是在一分钟左右完成了对200句话的翻译。
在今天来看,这种速度几乎不值一提,更何况整个程序还要装在一 块沉甸甸的硬盘里。但在当时,这一成绩给了王海峰和其他哈工大人很大的鼓舞。
以至于准备硕士论文期间,王海峰也选择了面向实例、基于模式的机器翻译作为课题,那时这一课题从国内学术进度来说还相对前卫。王海峰的研究,从一定程度上讲是在填补空白。
1996年,王海峰开始在哈工大攻读博士,由李生教授和时任哈工大校长助理的高文(现为中国工程院院士)共同培养。
而在此期间,他开始思考——自己能否去尝试一些更新的东西。
同年,高文就任于国家智能计算机研究中心,与摩托罗拉共同设立的先进人机通信技术联合实验室(JDL),王海峰作为博士生也一起来到了北京。
JDL这种携手外企巨头,横跨国家、连通校企的合作模式,在当时是十分罕有的,也从另外一种更独特的角度开拓了他的国际视野。
同时也是从那时开始,摩托罗拉和科研机构的产学联合模式,让王海峰第一次和产业界的真实需求有了亲密接触。
这种学术和产业的综合视角,一直影响着王海峰本人,并且由他将这种影响带到企业和很多学术组织中去。
当时,王海峰发现在海外(例如CMU),已经开始有人将神经网络应用到语音处理之中。
不过当时应用更广的是多层的BP神经网络,但其致命缺点,就是不能对上下文进行有效建模。
就此王海峰便在机器翻译上开始了创新之旅,他的创新举措在于,将循环神经网络的方法引入了机器翻译领域,提出了在BP网络基础上增加一个循环层链接,形成循环神经网络(RNN),来反映上下文关系,取得了很好的效果。
那个年代,这个想法在国际上也属超前。
博士期间,王海峰根据对循环神经网络的应用,发表了《基于神经网络的汉语口语言语行为分析》、《基于神经网络的汉语口语多义选择》等数篇论文。
在当时即使从世界范围来看,将循环神经网络引入机器翻译领域也不算常见,在国内更是首创。
1998年,刚刚从美国来到北京的李开复,在中关村知春路上的希格玛大厦建立了微软中国研究院。
两年后,其更名为微软亚洲研究 院并沿用至今——这个地方,被称为中国互联网的“黄埔军校”。
1999年3月,刚刚博士毕业的王海峰,迎来了很多人都会面临的人生抉择:如何选择职业方向?
李开复提议他加入微软,因为微软的Windows、Office等产品全世界都在用。
另一方面,王海峰对于学术研究同样执着,而想要同时兼顾学术道路与产业应用,当时的微软中国研究院似乎就是“注定” 的那个选择。
王海峰回忆说,自己在微软中国研究院一共工作了15个月,最重要的是见识到了学术界以外,产业界如何思考问题、解决问题。
这对于此后他始终坚持走在产业一线,投身人工智能的产业化进程至关重要。
2002年,王海峰加盟了刚刚建立的东芝中国研究开发中心。
东芝中国研究开发中心刚刚建立,王海峰作为三名核心成员之一,参与了东芝中国研究开发中心的几乎全部创 建工作。
在东芝这段时间,王海峰有较多的时间投入科研工作,进行了深入 广泛的基础研究积累,研究成果被应用于东芝的众多产品中。当时的应 用之一,是东芝的车载芯片。
而这一呆,便是七载。
在东芝这七年间,王海峰已经取得了较大的成就,成为国际NLP领域著名科学家,在自身职业生涯将满十年的时候,开始审视起了自己的职业规划。
王海峰当时对大环境的核心观察是:
原本在技术领域具 备优势的外企正在逐渐走向缓慢发展。
而中国本土企业,尤其是互联 网企业正在迎来高速发展阶段。
而王海峰在当时“山头林立”的众多互联网公司中,缘何选中百度?理由有二。
首先,从技术人才进行职业抉择的大方向上看,百度自诞生起就是一家具有技术基因、工程师文化的公司。而且立足于搜索引擎的百度,客观上来说蕴藏着AI研究者梦寐以求的宝藏。
另一方面,立足于搜索引擎的百度,又是连接千万用户的一个技术出口。
据王海峰自己回忆:
2007年的时候,我就感觉到未来是属于中国本土企业的。而从我依然希望投身产业界的角度来看,高速发展的互联网产业是最佳选择。
在互联网公司中,百度显然又是最擅长技术, 最尊重技术人才的。
而期间发生的一件事情,成立王海峰加入百度的“定心丸”。
2009年8月,百度召开了第四届“百度世界大会”,李彦宏在本次大会中推出了全新计算平台“框计算”。
这项技术概念,是指百度用户可以在“百度框”中输入服务需求,系统就能通过理解用户输入的语言指令,对需求进行智能化理解,然后将其分配给最优的内容资源或应用提供商处理,最终返回给 用户匹配后的结果。
而百度的“框计算”构想,恰好让王海峰看到了自身所学的用武之地。
初入百度的王海峰,由于此前的专业是机器翻译,而机器翻译与百度的搜索引擎技术体系,事实上存在着不少范围上的出入。但王海峰的 学习能力和工作精力,让这个出入很快得到了填补。
王海峰的到来,让百度又多了一丝学术气息,并开始迈出了参与国家项目的科研脚步。
在此之前,百度很少参与国家项目的申请,这类项目往往都是科研院所申请。但在国际上,很多高科技公司都会参与其中。
王海峰下决心改变现状,没人写申报材料,他自己来写。
在成果上,王海峰也和团队取得了飞速的成就。
当时百度参加了国家高技术研究发展计划中的机器翻译项目。在立项时,王海峰表示他们可以在中英机器翻译上超过谷歌,当时在场的很多专家都表示难以置信。
事实是最好的证明,这一项目的执行周期原本为三年,而百度翻译在一年多的时间里,就在中译英准确率上超过了谷歌。
2010年王海峰在百度正式开启工作时,所做的第一件事就是成立了“自然语言处理部”。
以服务搜索引擎中产生的相关需求,进而又在语音、图像技术上推进当时名为“多媒体部”的诞生,以及敲定了 百度在知识图谱技术上的研发投入。
对于今天的百度来说,这三个方向的累积可以说是为后续AI技术 从无到有、深入发展奠定了至关重要的基础。
例如2011年,百度推出的基于机器翻译技术的产品“百度翻译”,就是在NLP部门的支持下完成,随后不断在这一产品框架下进行技术的更新迭代。
正是这种高频 应用场景和先进技术的碰撞,让百度在2015年推出了世界上第一款互联网神经网络翻译系统,跑赢了谷歌、微软等企业。
但王海峰对自己在百度的定位,远不止于NLP,应当是把基础的学术能力泛化输出。
于是几乎在成立了NLP部门的同一时期,王海峰就已开始着手布 局语音技术和视觉技术,牵头组建了当时的“多媒体部”。
在王海峰的极力推动下,“多媒体部”很快就取得了大量的研发成果:
在语音方面, 有围绕语音识别的复杂声学建模、海量语言模型和高速解码等关键技 术;
在图像方面,则进一步推进了图像识别、图像分类、图像搜索以及OCR等技术的完善。
在这一时刻,百度也在某种程度上完成了从产品需求引领技术更新,到技术进化推动产品革新的发展。
在2012年年中,百度多媒体部门开始推动这些技术的产品化,使其进入了用户的视野。
建立在图像的智能化理解能力之上,多媒体部门推出了一款图片搜索引擎“百度识图”。
语音的智能化理解则被整合到了移动端,在手机百度、百度输入法、百度地图等产品中加入了 语音输入功能。
2017年,百度股价再创巅峰,AI成了最重要的功臣。
其中很大 一部分原因在于,百度不仅用AI技术对原有业务进行了提升,还进入了自动驾驶、语音交互硬件等全新的领域。业务范围的拓展,显然和技术能力的拓展不无关系。
建立在这一基础之上,AI技术能力的累积,让百度在AI发展方向上,可以直接走向C端市场而不是仅仅向B端提供技术赋能。
如今从百度AI的全面布局来看,王海峰建立的多媒体部,以及带领多媒体部所累积下的基础,可以说是确定了百度AI未来的发展轨迹。
与此同时,在从学界到产业的不断探索中,王海峰发现了一个很有趣的问题,即“开源”和“开放”两个概念的异同。
在科技企业的开发者生态中,开源是一种很普遍的文化,开发者们彼此分享源代码,通过对代码的修改编译来完善产品。
很快王海峰 就发现,对于AI来说,仅仅开源是不够的。大部分渴求应用AI技术的产业中并不具备专业的技术人才,对于它们来说,需要的是一个操作 简便的平台,提交数据后就能直接获得结果。
于是在机器翻译、NLP等领域取得突破成就的同一时期,他开始向前推进百度更大图景的技术平台化政策。
直到如今,我们仍能够看到百度技术平台化的第二步工作——不 断打造可供产业全流程使用的平台和工具接口,深入细节场景,最终 形成了我们所看到的百度大脑AI开放平台。
通过百度大脑开放软硬件产品与服务、专项解决方案、定制化训练平台和深度学习开放平台。
尤其是深度学习开放平台飞桨,以及基于飞桨打造的定制化训练与服务平台EasyDL,这二者的存在,在中国AI产业化发展的蓝图上 画下了重要的一笔。
除此之外,既然要做“泛化输出”,就需要紧随科技发展的时代浪潮。
对于云和产业智能化,王海峰也没有落下。
今年5月,王海峰发布百度智能云全新战略,他表示:
全新升级的百度智能云,融合云计算、百度大脑、大数据等百度核心技术,正在把人工智能输送到千行万业。
也正是王海峰如此的战略,让百度的每一个“节点”,无论是百度大脑、飞桨还是智能云,都成为能够支持产业智能化、AI进入工业生产重要的环节。
即便时至今日,王海峰在百度这片沃土上,已经让AI“遍地开花”,但真正的“结果”,还远不止于此。
三十年河东,三十年河西,中国AI从一个独立而贫瘠的孤岛,发展到了如今“无处不在的盛况”。
从王海峰个人在这三十年的AI浪潮故事中,可以用别样的视角,洞察到这期间中国AI点点滴滴的变化。
而更直观的,可以看下一组数据:
德国公司IPlytics发布了一项关于人工智能技术专利的研究报告,报告分析了2008—2019年的448684项专利,结果显示,截至2019年1月,中国平均每年的专利申请达到了66508项,位列世界第二。
中国新一代人工智能发展战略研究院发布的《中国新一代人工智能 科技产业发展报告(2019)》和《中国新一代人工智能科技产业区域竞争力评价指数(2019)》显示,在应用层面的专利申请上,中国已经位列世界第一。
同时,报告还显示,我国论文发文量居全球第一,论文总被引次数位列全球第二。可见在人才方面,中国也在疯狂追赶。
当然,这样的数据,还有很多很多。
而从一无所有,到如今在国际成为不可或缺,绝不仅仅是王海峰一个人,更是众多与他同一批经历这样历史变迁学者们的默默付出,“后浪”们前赴后继的努力,更是技术笃信者用尽青春,最 终抵达的工业革命序幕。
然而,这样的三十年,只是一个中国AI的一个开始,正如李生教授所说:
现在中国AI需要做的,就是消除一些短视行为,不盲目沉迷于一时 的收益,扎扎实实以科学的态度做科学的工作。
在追求科学与真理的光明坦途上,中国AI还会走过无数个30年。
参考:
《AI已来:让中国AI走向世界的王海峰》
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
「数据库」系列公开课开启,快来免费报名!
6月23号第二期直播,浪潮信息数据库产品线总经理--乔鑫分享「传统企业互联网下的数据平台升级」,将讲述HTAP数据库的技术原理、优化方案以及开发部署概要等技术问题,以此带给广泛关注者一些前瞻指导。
扫码报名,可加入直播交流群,还可获取系列课程直播回放、分享PPT:
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !