什么是数据中台?
什么是数据中台
- 数据中台是什么?
- 数据中台与数据仓库有什么区别?
- 数据中台到底怎么与业务中台融合?
这三个问题,一直是在数据中台讨论过程中被问的最多的问题。
在回答数据中台是什么这个问题之前,先了解一下大家比较熟悉的数据仓库是什么。
在以BAT为首的互联网公司蓬勃发展起来之前,国内三大运营商对于数据仓库的建设走在其他行业的前面。
早在2011年的时候,中国移动集团公司就组织编写了指导各省公司建设数据仓库的纲领性文件《中国移动NG2-BASS3.0建设规范》。
在文件中,明确将中国移动的业务分成了7大业务板块,按照功能将数据资产划分为三层:数据层、功能层、应用层。
这是很典型的数据仓库建设的分层模式,如今的数据中台数据分层建设模式也延续了数据仓库的分层建设规范。
中国移动数据仓库分层模型
上面是应用层规划的内容,详细规划了每个应用领域的数据应用。但是仔细研究可以发现,这些数据应用几乎全是“分析”,也就是解决了事后“看数据”的问题。
再来看看下图中,阿里巴巴的数据中台支撑的数据应用层。
除了通用的数据分析以外,还包含了“个性化推荐”、“风险评估”、“预警监控”等与业务紧密结合的数据赋能业务的应用。
而这些丰富的赋能业务的数据应用必须依赖数据中台提供的强大的数据服务支撑。
通过上面的对比不难看出,数据中台与数据仓库最大的区别就是数据中台更加贴近业务,不只提供分析功能,更重要的是为业务提供服务,与业务中台或者业务系统(老旧系统)链接更加紧密了。
就拿大家比较熟悉的“千人千面”案例来说,除了要整合业务系统产生的用户基础属性、订单、评价、加入购物车等行为数据,还要通过埋点的方式实时获取用户偏好浏览、搜索、分享商品等行为数据,经过数据中台一系列的数据加工处理后,最终以微服务的形式提供。
在业务系统每个需要呈现商品给目标用户的数据服务处,已不是简单的、一成不变地去商品库查询数据,而是调用数据中台提供的商品推荐接口,以此来根据不同的人群偏好、浏览历史、商品相似度等数据来为每个人推荐他最感兴趣的商品。
试问,这种业务、数据紧密联动的场景在数据仓库时代又如何能做到呢?
在介绍完数据中台与数据仓库的区别之后,我们再回过头谈谈数据中台到底是什么。首先说说数据中台不是什么。
第一,数据中台不等于大数据。
近些年来,“大数据”这个名词可能是被提及最多的词汇之一,大数据甚至成为国家战略。同时,“数据中台”也正是在大数据概念兴起之后应运而生的。
因此,不可避免的,相当一部分人把数据中台和大数据划等号。
一提到数据中台,天然的就想起Hadoop、Spark等大数据处理技术。
这样的想法是不对的。
这些大数据处理技术只是数据中台的基础设施提供者。大数据技术的大行其道,加速了数据中台战略成熟。
第二,数据中台也不是一个研发工具。
此前市场中有这样一种情况,说某某公司有一个数据中台产品可以卖给客户,但实际交付给客户的仅仅是一个可视化的研发工具。这种情况是在忽悠客户。
因为数据中台一定是整合了企业自身的数据并经过加工、治理后形成的企业自身的数据资产平台,而并不能只是一个可视化的研发工具。
那么如何定义数据中台呢?
我们也曾尝试在网上找到一个标准答案,找过首倡“数据中台”概念的阿里大咖们寻求标准答案。
现在网络媒体上各种数据中台分享、解读、峰会纷纷扰扰,各种解读真是乱花渐欲迷人眼,但都没有得到一个很精炼、标准的数据中台定义。
但越是没有标准,越是被人问得多,这就是为什么开篇提到的第一个问题就是“什么是数据中台”。
经过这些年来对数据中台的一腔热血,也曾经为此翻阅大量资料,力求言简意赅,力求精准定义,我们认为:数据中台是一个用技术链接大数据技术能力,用业务链接数据应用场景的能力平台。
“链接能力”是数据中台的精髓。作为一个处在中间层的能力平台,“链接”是其根本的任务。
在业务层面需要尽可能链接各种数据源作为其生产资料;
同时,由于生产数据的场景越来越多,覆盖了线上、线下等多渠道,各数据生产资料之间也需要进行链接,才能形成全域的数据;
数据在数据中台这个平台上按照标准的模型进行规范的加工处理后需要服务于多种场景,同样需要我们提供标准的数据服务接口将数据与应用场景链接起来。
因此,链接是数据中台的根本能力,也是数据中台的价值所在。
更多中台干货内容,关注微信公众号【云徙科技】