记者 | 杨丽
出品 | AI科技大本营(rgznai100)
为把握时代特征,2016 年中国移动确定并大力推动“大连接”战略,并制定了“十三五”时期做大连接规模、做优连接服务、做强连接应用的三个目标。如今,这家企业已经拥有 9.16 亿移动端用户、1.47+ 亿家庭宽带用户、300+ 万基站,带来的是每天超过 60PB 的网络数据和运营管理数据。
考虑到数据的价值,早在 2013 年,中国移动就开始了企业级大数据平台规划与建设,在这个基础上,2016 年中国移动启动统一的大数据 Hadoop 平台建设,总体目标是搭平台、聚数据、强管控、建生态。具体来讲,有以下四方面:搭平台,依托资源池建立集中化分布式集群;聚数据,把中国移动各省数据融合,也融合外部行业的优质数据;强管控,数据不出系统,系统不出移动;建生态,面向社会各界提供开放平台服务,共同建设面向“大连接”的大数据开放生态。
在此背景下,中国移动云计算、大数据和 IT 支撑系统的研发中心——中国移动苏州研发中心(下称“中移苏研”),从 2014 年 3 月注册成立至今,已成长为集团内部最重要的云计算和大数据软件服务平台供应商。目前,中移苏研内部大数据业务主要包含两方面:
一是为总部的 IT 系统集中化提供服务;
二是服务于中国移动省公司和专业公司,提供包括大数据咨询、建设方面的服务;同时还会将已在公司内部落地、经过检验的产品和解决方案对外输出。
在近日召开的 2018 中国大数据技术大会(BDTC)上,中移苏研首席科学家兼战略技术部总经理钱岭作为交通与旅游大数据分论坛主席出席参会,并接受了 CSDN AI 科技大本营的采访。
关于钱岭:首席科学家,中国敏捷开发十大贡献者之一。现任中国移动苏州研发中心战略技术部总经理,中国移动技术咨询委员会 IT 专家组成员。同时,兼任工信部数据中心联盟大数据促进委员会副主任委员,中国计算机学会大数据专家委员会通信委员,苏州人工智能和大数据产业联盟副主任委员。
中移苏研将为公司承建超过 2 万节点的大规模 Hadoop 数据集群,并将新型硬件用于大数据平台,以提升大数据处理速度;同时,希望通过 IT 系统自建,将总部和各省的 IT 系统做到一定程度的协同,构建全集团 1+N 大数据协同计算平台。
以下为专访内容:
1)公司对您的定位是怎样的?
钱岭:从今年起我开始担任首席科学家的职位,公司对我个人的定位是不止做管理,还要在技术方面有一些新的进展。一方面要领导公司所有部门的产品方向和战略研究方向,包括云计算、大数据、IT 支撑系统的研发与集成服务,这是公司的三个核心部门,大约有 1000 多人;同时我负责的战略技术部,也是公司战略、研发管理的重要部门。
此外,公司还有技术咨询委员会,我也参与其中。
谈商业模式:大数据更像是一种“倍增器”
2)作为电信运营商,在数据的量上掌握了一定优势。您之前提到业务模式的不同,大数据平台的应用没有得到大规模发展,那么苏州研发中心如今构建的大数据处理架构有哪些变化?
钱岭:大概在 2017 年前后,很多业界大数据领域的公司转型成为人工智能公司。一个原因就是其原先的大数据业务发展受限,数据本身不可以做交易了。
以近年来的两起重要案件——某单位销售数据被查案件、以及今年的某单位数据营销事件为例,可以看到至少有两个业务领域是不能涉足的:一是数据直接销售模式;二是用个人隐私数据做精准营销的模式。
自从 2017 年 6 月 1 日的《网络安全法》以及两高对个人隐私的司法解释出来以后,表明关于大数据的很多业务是不能做的。中国移动数据的一个特点就是会跟个人隐私相关,所以很难开展这类业务。
我们会从其他角度去思考大数据的应用出口问题:
一类是类似于为政府或行业如旅游局、国家统计局提供服务,此类应用不会非得精准到个人的隐私数据上,因此一定是可以大力发展的;
第二类数据应用就是物联网,如智慧交通。随着明年 5G 的到来,如视频、统计类的数据,涉及物体的某些信息是可以进行使用的。当然,这也要看法律的解释。
大数据未来怎么发展?为什么需要人工智能?现在“实时处理+人工智能”现在变成了数据处理的一个核心途径。
3)此前联通大数据部负责人赵越女士也提到了“海量数据处理难”的问题,结合中国移动“大连接”战略,物联网建设带来的数据量激增,对咱们的具体落地有哪些影响?
钱岭:中国移动“大连接”战略进展得很好,部分省份新增连接数实现了“物超人”,这说明物联网的连接数量发展是非常惊人的。
“物超人”之后,接下来要做的一个事情叫做“下一代网管”。这里面的第一个业务就是窄带物联网(Narrow Band Internet of Things, NB-IoT)管理系统,该项目大概做了一年,今年可以交付一个试商用版本,明年就可以商用。随着明年 5G 实验网建设的启动,像人工智能、自动驾驶、智能工厂的业务就可以接入了。
这时,数据量的激增就会比原来的窄带物联网更多,基本的趋势也是数据量会持续加大。所以我们对计算能力、数据安全、自动化智能化处理的需求是非常大的。
4)对于大数据商业模式的思考,您认为除了为公司自身业务起到降本增效的作用之外,还有哪些可以跟外部数据进行结合的点?
钱岭:我们在 2010 年就总结过大数据的几个主要应用场景,包括网络优化、决策支持、精准营销,此外还有智慧审计等应用于企业管理的场景。
如果大数据本身作为一种业务进行销售的话,风险越来越高,以后物联网可能会好一些。但大数据本身应用于业务,就是需要跟其他东西结合在一起。我们当时的一个方案叫“移动大数据+”,就是您本来已经有行业应用了,加上移动大数据的分析结果会更有用。
5)可以说中国移动当前大数据的主要应用方向是旅游和交通行业吗?
钱岭:移动的大数据应用是全行业的,不过总部大数据平台的第一项应用是旅游和交通行业。因为中国移动的大数据主要是位置类的,它的最好应用就是旅游和交通,这也是我们位置类数据的一个优势。
此外,中国移动很早就联合招商银行成立了征信公司“试金石”,服务于个人业务数据;还与德国电信成立了车联网公司“中移智行”,后来因德电撤资成为中国移动全资的专业公司。
总结起来,移动数据的独特性其实是两方面:一是位置类,二是个人的通信信息,前者可用于交通旅游,后者可面向征信。
6)那么是否可以将中国移动称为一家大数据公司?
钱岭:其实中国移动是一家“大连接”公司,因为它的主营不是大数据。马云曾给阿里定了一个目标,他说“我们现在是一家电商公司,那么我们接下来要做金融,未来可能是在大数据。”这个说法背后实际上就是看它未来带动收入的方式是否一种“倍增器”的方式。只有当一家公司的很多业务模式已经极度依赖于大数据时,它可以称之为是一家大数据公司,但前提是您的主营业务要变成这样。
目前中国移动的核心业务还是网络和通信。
7)具体到 2B 业务这块,在您看来中国移动会大致是怎样的发展模式?
中国移动的政企客户大概有几百万的数量。我们也在积极思考当中,即如何将中国移动的优势网络和通信资源和云计算、大数据融合在一起,形成粘性更强的业务。
谈人才建设:本科阶段不太适合教得太深
8)之前中移苏研的王宝晗老师也透露咱们大数据部门下设的有一个组是 AI 方向的,能否讲讲中国移动在包括 AI 等前沿技术研发方面的落地情况?
钱岭:中国移动通过研发改革,这几年成立了很多专业公司。其中,中移苏研是做基础的云计算、大数据平台和人工智能应用。这种业务模式跟以前面向省级运营的方式不同,是一种横向业务能力的打通。
目前上述所有提到的专业研发机构都会涉及到人工智能领域,包括自然语言处理、知识库、图像识别、语音识别、网络优化等。
除了完善现有的核心算法之外,更重要的是把成熟 AI 算法应用到我们的各种业务里,比如基站天线的矫正。
9)为什么选择苏州?选址上有哪些考虑?
钱岭:主要跟当地政府的优惠政策相关,苏州政府在对企业、对个人方面均提供了很好的政策,包括用地、交税、对核心员工的激励政策、购房政策等等。当然中移苏研也在帮助政府向高科技方面转型,例如,正在支持苏州申报软件名城。
同时,人才也是重要因素,尽管相比北京、南京等城市,苏州的高等院校并不多,但是苏州人杰地灵,像中移苏研就吸纳了很多来自上海、杭州、南京、北京等地想要回本地发展的人才。
10)南京大学的周志华和清华大学的孙茂松老师有过对开设 AI 课程的意见之争,放在大数据领域,您会如何鼓励学生/从业人员去学习大数据?
钱岭:我自己在清华大学求学时,本科曾上过《人工智能导论》课程,但当时还是一个比较年轻的状态,对这个技术的应用是仍是懵懂无知的。就本科阶段而言,其实是不太适合去教授过深的东西。《人工智能导论》这本书里面的几个主要算法其实还是很不错的,开拓了学生的视野。学生往往是为了考试而学,而非应用创新而学习,真正重要的想法形成,其实是在硕博期间。
在大数据领域,金字塔底部的和顶尖的人才我们都需要,关键看培养目标是什么。本科阶段教授的东西是为了让他形成固化思维,但不会有创新;更高阶段上,通过筛选,我们才把他培养成我们想要的人才。
11)中国移动是否缺乏这样的顶尖人才?我们可能会看到科学家们都去做研究、待在实验室里,反而不在企业中。
钱岭:开发人员实际上不属于科学家这个行业,但一定是培养科学家的一种很好的途径。只是互联网的泡沫经济把开发人员的价值高估了,导致软件企业无人可用。说到底,互联网永远是商业模式的创新,它没有解决核心的关键技术创新。
科学研究可以由院校承担,但是成果转化必须通过企业开展,可以看到中国被美国限制的几个领域如 CAE、工业软件、航空软件、机器人软件,为什么这么难做?因为开发人员不能只会编程,还要懂业务,懂算法和模型。这种人才无论是云计算、大数据、人工智能、边缘计算都是一样,不懂行怎么做?
中国移动正在通过研发改革,成立公司化运作的专业公司,吸引和培养顶尖大数据、人工智能人才。
12)您从 2008 年就开始参加 BDTC 大会,对此您什么想说的?
钱岭:大数据依然是个热点。重点正在朝着更多的方向发展。
回顾往期,您会发现从 2017 年起 BDTC 大会开始筹备一些比较细分的行业分论坛。其中一个变化在于,它是跟行业应用相结合的,这跟我们的关注方向也比较吻合。另一个变化则是,2014 年前后大数据主要探讨还是偏“数据湖”等技术概念的应用,这是因为当时的大数据应用还不成熟,Hadoop 能不能用还是个问题。
所以接下来会怎么走?现在已经倾向于数据管理、人工智能、数据安全等新的问题。
(*本文为AI科技大本营原创文章,转载请联系微信1092722531)