摘要:在过去,面对存储和计算成本过高的问题,维度数据建模出现,它基于类似星形的架构或雪花架构构建,维度围绕事实数据表,可以对计算和储存进行优化。如今,维度数据建模已经逐渐淡出大家的视野之中……
原文链接:
https://blog.devgenius.io/learn-from-googles-data-engineers-dimensional-data-modeling-is-dead-68f6c2cb3fb0
声明:本文为CSDN翻译,转载请注明来源。
作者 | DataExpert
译者 | 朱珂欣 责编 | 屠敏
出品 | CSDN(ID:CSDNnews)
计算早期,存储成本很高。
计算早期,计算成本很高。
如今,维度数据建模逐渐消失在大众的视野之中
但是,在大数据时代,技术的发展日新月异发展,也在潜移默化中推动着存储和计算发生了改变。随着大环境的变化,维度数据建模的优点逐渐被削弱,缺点却被放大,以至于维度数据建模越来越少。
存储几乎免费
如今,每月 1GB 的 AWS 云存储成本,仅仅只需要2美分。
相比较之下,维度数据建模将长表或宽表分解为星形或雪花模式的回报率很低。云存储以每年几美分的价值计算时,成本不再成为考虑因素,云存储也能更加适应大众的需求。
计算成本低廉
伴随着云架构的出现,目前计算可以做到轻松扩展,并且请求其他资源以应用于长时间运行的查询变得容易,因此计算成本更加低廉。
维度建模对于普通用户来说很难理解
对于数据工程师而言,可以查看并直观地理解数据建模,但对于普通数据消费者而言,会觉得它并不直观,也不易理解。
尺寸模型的维护成本高昂
未来,数据设计的发展方向在哪里
近来,数据湖和数据湖屋逐渐成为大家关注的焦点。数据湖能提供更好的最终用户体验,维护成本低廉,并且不需要额外的工程资源来构建。数据湖的主要好处是业务的可用性。
过去,分析师或商业智能工程师曾经需要解释复杂的数据模型以向业务交付价值。如今,通过数据湖可以将数据直接从源连接到最终用户。分析师和商业智能工程师可以专注于解决更有价值的问题,例如用于构建预测管道的工程功能。
数据湖最近的成功表明,计算和存储资源不再因略微减少而受益,但可用性的提高已被重新发现为数据生态系统的重大整体提升。并且,曾经在数据维度模型上的维护成本,可以用于为业务创造快速价值。
总的来说,在过去维度数据建模让数据规范化和执行数据规范化,让数据更加井井有条。但是,随着目前很多团队在数据湖和维度模型的成本后,维度数据建模越来越少,逐渐淡出大家的视野之中。维度数据建模真的不再具备实践价值了吗?我们把答案交给时间。
☞