为什么建数据仓库要分层?

关注者
33
被浏览
32,382
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

在数据仓库处理数据流程中,为了能够有秩序的处理数据、减少重复开发、统一数据出口,简化问题这些方面的考虑,构建数据仓库都会进行分层,分层一般分为5层:ODS层、DWD层、DWM层、DWS层、DM层,其中DWD层、DWM层、DWS层就是我们所说的数据仓库DW,当然现在每个公司中构建以上5层都叫做建设数据仓库,一些公司对不同层的命令也有所不同,但是每层的功能大致一样。


ODS操作数据层主要是直接存放业务系统抽取过来的数据,将不同业务系统中的数据汇集在一起,这一层不建议进行过多的数据清洗。


DWD数据明细层主要是保证数据质量,在ODS层基础之上对数据进行加工处理,提供更干净的数据。


DWM数据中间层主要是对通用的维度进行轻度聚合操作,计算相应的统计指标,方便复用。


DWS数据服务层,主要是按照业务主题组织主题宽表,将数据拉宽,用于OLAP操作。


DM数据集市层,主要是基于DWS宽表数据进行分析、整合、汇总,分析得到某一主题域的报表数据。