讲师介绍
程永新,新炬网络董事/副总经理,大数据领域资深专家,多项国家发明专利持有人,数据资产管理五星模型提出者,18年电信行业信息化管理经验,计算机本科、工商管理硕士、EMBA。
本文根据程永新老师在〖2018 DAMS中国数据资产管理峰会〗现场演讲内容整理而成。
2018年大家都看到了一些数据战争,这不是偶然发生的。诸多重量级企业,如脉脉、微博、百度、美团点评、Facebook、华为等为了直接占领数据入口,甚至不惜诉诸法律。
数据作为一种资产已经达成共识。但企业将数据作为一种资产来管理时,面临的问题却越来越多。各个国家、行业的法律法规对数据资产管理也提出了更高的要求。例如,GDRP一出台就开出天价几百亿的罚单。而在去年,国内知名咨询机构艾瑞咨询发布了一个大数据能力框架,明确了数据资产管理对于大数据能力的重要性。
其实作为数据资产管理来说不在乎是不是大数据,而在于这个数据如何把它作为资产利用起来,是一个资产化的过程,这也是我们五年前提出数据资产管理概念的初衷。
数据管理随着计算机管理系统的产生而诞生,发展至今有近40年的历史了,而随着数据仓库应用的展开,在2000年左右数据治理的相关理念也逐步形成。而数据资产管理的概念也就是这几年的事情,我们认为数据资产管理应该是“数据管理+数据治理+数据资产化”的过程。数据作为企业的特殊资产,与传统的固定资产、虚拟资产不同,需要有自己的一套管理过程和管理方法。
下面我们简单回顾一下数据管理/数据治理的管理理论和模型框架,以及为什么我们提出五星模型和迭代进化历程。
2004年,国际数据治理协会DGI就首次发布了DGI数据治理框架,从这个框架模型我们可以看到,它只是提出了一个对我们今天来说几乎是常识的RPP(人员/流程/规则)框架。但是,这个框架中没有对数据治理的具体工作内容给予细化或明确说明。
到了2006年,国际数据管理协会(DAMA)发布了数据管理框架,并参考了PMBOK的架构编写了数据管理指南(DMBOK)。这个框架模型覆盖了组织的七个领域,将工作细分为十个领域。
在2014年,CMMI发布了数据管理成熟度模型,它包括了六个维度,以及五个成熟度评估等级。以CMMI在行业内的影响力,这个成熟度模型在国际上的影响力相对比较大。
在国内,今年5月份,银保监会正式发布了金融机构数据治理指引。从相关主题的数量,可以看出金融机构数据治理指引主要关注的是制度、人员、流程、监管等相关方面建设。差不多同时,数据管理能力成熟度模型的国家标准也发布了,但是由于银保监会在金融行业的巨大影响力,我们看到实际上金融机构数据治理指引的影响力远远比国标大。
我在准备这个演讲的时候,很无聊地去全国标准的网站上简单搜索了一下,上面是统计结果,可以看出数据是多么的火热,几个维度的统计数量都远比软件多,这可能也解释了为什么不是每个国标的影响力都有那么大。
数据资产管理AIGOV五星模型,历时五年持续迭代更新。2014年我们在行业中首次提出数据资产管理的概念,当时我们提出了数据资产管理的核心框架:数据架构、数据治理和数据运营;2015年我们首次发布了数据资产管理五星模型,此后在每年DAMS中国数据资产管理峰会上,我们都迭代更新一版。今年是第四版,正式命名为数据资产管理“AIGOV五星模型”。
相比于其他国内外的标准/模型或框架而言,我们更关注数据资产管理的全局视角和整体过程,这样我们的管理者或从业者可以更清楚了解整个数据资产化价值实现的过程,而不仅仅说我们只做数据管理,或者数据治理。
我们将数据资产管理领域的相关工作划分成五个管理域:第一个管理域是数据架构策略,针对管理体系,就是人员的组织结构,以及相关策略制度等;第二个管理域是数据集成共享,针对数据资产管理的技术平台,包括如何管理数据的采集、集成以及数据共享中心建设等;第三个管理域是数据治理,这部分就是传统数据治理的范畴,包括数据模型管理、元数据、数据标准和数据质量;第四个管理域是数据运营管理,核心是如何提升数据安全和运营效率;第五个管理域是数据增值应用,通过数据分析挖掘和开放服务,真正将数据服务于企业和企业的战略联盟间,提升数据价值、实现业务互动。
下面是五大管理域、13个能力项的相关工作说明。
虽然数据架构策略只有一个能力项,但并不是说该部分的内容不重要,相反,专业乃至专职的团队是一切管理的前提,没有组织,没有专业的团队,再好的策略计划、规章制度只会是一纸空文,无法落地。基于当前国内的现状,可能很多甲方采取的方式是自己有专人负责落实相关架构和数据资产管理策略,同时引入像新炬网络这样有整体解决方案产品的专业第三方团队,来快速实现数据资产管理平台建设和五大管理域的执行工作,比如数据采集集成、共享数据中心建设等。
打破企业历史沉淀的数据孤岛,通过数据采集、集成进行有效整合,构建企业级数据共享中心,既可以满足企业内部数据交互、访问、共享的业务需求,又不需要像一般大数据中心那样投资成本过高,导致投资收益比很差。
从数据采集开始,我们就强调元数据的驱动作用,可以让数据采集、处理和汇聚等过程更加规范和可靠。如果是新建系统,这同时也是一个正向建模的过程。
当然,很多大型企事业单位,同时存在着大量的存量系统,这些已经在线运行系统的数据模型可能并不清晰,形成事实上的数据黑盒子,这个时候我们就需要进行逆向数据模型梳理,把数据模型整理清晰可以更方便我们清楚企业数据的基本概貌,建立企业级数据资产管理的全局观。
接下来就进入整个数据模型的管控过程,这是一个基于版本化的管控过程,包括模型设计、评审、分析稽核和版本管理等。
结合数据资产管理平台,我们可以轻松将企业级的数据标准、数据模型、元数据和数据质量实现整合、打通,以数据地图、数据资产目录等方式实现资产可视化,同时做到:
企业级多维度元数据视图,提供可视化的展现、检索和查询,上下文的数据血缘关系分析,以及预览数据处理和变更对全局的影响度分析;
通过平台产品的监控、稽核和版本管理能力,帮助我们实现数据标准、元数据设计稿与实际业务系统之间的差异,防止元数据与实际系统之间出现“两张皮”的现象,维护元数据的权威性和准确性;
通过平台也可以将PDCA的质量循环有效落地,实现可视化的数据质量监控、规则调度和检查报告,从而推动数据质量的优化提升。
在某个省级电网公司,新炬网络与客户一起构建了联合的数据资产管理团队,通过分阶段实现了数据资产管理体系建设、数据资产梳理以及数据资产平台建设等工作,让客户可以可视化地管理自己的数据资产,为后续的增值应用打下良好基础。
在教育行业的某个客户案例中,新炬网络帮助客户从建立数据标准规范开始,搭建了整体数据集成共享平台,实现了可视化的数据集成整合,通过拖拽就可以轻松完成,展现清晰的数据分布和来龙去脉,实现数据治理可视化和数据共享中心的统一建设过程。
从数据运营管理的角度来说,核心是两个业务场景:一个是数据生命周期管理,通过合理、完整的数据生命周期管理解决方案针对不同类型的业务数据进行贯穿其整个生命周期的自动化分类、分级存储、归档和销毁管理过程;另一个是数据安全管理体系,包括数据安全制度和开发规范,以及对现有数据进行敏感分级分类,从而制定和完善数据脱敏、安全审计、数据提取和测试数据管理等不同应用场景下的数据安全管理。
数据运营管理中,还需要关注SQL代码审核。虽然SQL代码不算严格意义上的数据资产管理范畴,但因为我们都理解的一条SQL搞死生产系统的悲剧经历,在实际数据运营管理过程中,我们顺手做了一套数据库性能分析和SQL审核管理工具,帮助客户有效降低生产环境下SQL引发的各种问题。
下面这个某大型制造企业的案例中,新炬网络帮助客户实现了数据资产管理五星模型的快速落地,通过数据资产管理平台整体解决方案,实现了数据模型、元数据、数据生命周期和数据安全的统一管理,有效解决了之前困扰客户的数据资源分散、信息不公开、数据质量不高、数据黑盒化、安全管控不足和数据容量问题等。通过个性化的数据门户,面向企业内部的不同用户和开发人员,赋予不同权限的快捷查询和实时检索能力。
数据资产管理第五个管理域是数据增值应用,包括对内的数据分析挖掘,给业务赋能,以及对外部产业链的数据开放服务。独角兽现在很火,我想问一下在座各位,你们都知道在过去一年里面,最佳的独角兽捕手是谁吗?
网上有人统计了一下,2017年9月至今,共有17家独角兽IPO或提交IPO,TOP5的投资机构里面,不是我们想象的那些传统的知名VC/PE,而是BAT悉数在列,腾讯更是独揽9家,成为独角兽最佳捕手。这是为什么?我想大家都知道,这不是因为BAT的钱更值钱,而是因为他们手上有大量的数据!天量的用户和数据自带流量和风口,比如微信之于拼多多。
凯文.凯利曾说过:“不管你现在在做什么生意,对于未来来说我们做的都是数据生意。对于我们来说,客户和关于客户一切的数据是同样重要的。”
我相信这是真的,这是一个数据的时代,更是一个数据正在资产化过程的时代!新炬网络专注企业级市场12年,我们愿意与您一路同行。
近期热文
Flume+Kafka+Storm+Redis构建大数据实时处理系统