经验分享 :数据治理中的有趣发现

2019 年 9 月 24 日 数据分析
本文整理自老树之见 公众号,原文分 数据治理中的有趣发现(一)与(二)组成,本文将两篇文章整理加工在一起发文,若想查看原文,请点击“阅读原文”。
数据治理,一般来说,涉及数据获取的治理、数据流程治理、数仓模型治理、数据权限治理、指标体系治理、数据应用能力提升、分析框架治理、数据可视化方案治理等范畴。有着内容涵盖广,琐碎的细节多,外在体感弱,成效周期长,人员心力要求高的特点。

随着近期工作中对数据治理的深入,尤其是在指标治理范畴下,过去的许多认知,在深层次上被刷新了;同时,随着执行中各种细节的碰撞,也有了不少新的发现和观点。酝酿多时,打算甄选若干,希望对大家有所帮助。

(当然,本人目前的观点,仅来自本地生活场景下的实践,难免有些片面,读者们请批判地吸收。

观点一:“数据治理,从最初的最初,就要有所设计。

这话看起来较费解,何谓最初的最初?
如果你是一个创业者,那么你在团队成立的第一天,你就得规划,做些什么样的事,能让你不仅拥有数据,还能正确高效地使用数据。 以我对身边朋友的观察,大部分人,会想到要拥有数据,但以为初期有这就够了
如果你是一个经理人或者决策层,你需要在一个新业务的起步阶段,即在业务规划中,就准备好以“精准量化分析”为目的的一整套的数据治理方案,而不要仅仅罗列几个指标,作为KPI,以体现所谓的“数据驱动”。
如果你是一个项目经理、产品经理或者业务运营,你需要在kickoff阶段,就有方案,以保证健全的数据获取通道,准确稳定的指标口径,多方一致的评价及分析方式 而不是认准领导的绩效,硬拼凑一个本质上也许毫无关联的评价指标。
以我目前的观察,在业务启动初期,数据治理方案的缺失,会使得数据混乱的发展速度,远高于业务发展速度。 回过神来你会发现,你以为能靠数据结果给予决策支持,但实际上,你会有一堆的混乱结论。 你想有座灯塔,可实际上是一片迷雾。

观点二:如果你是一个leader,当你不能准确了解你所使用的指标口径,就不要推动所谓的“用数据说话”。

乍一看,这个观点或许有些极端,但自测一下这个问题,或许你会猛醒:
“你工作中经常查看的报表和数据,你能说清楚他们明确的计算口径么? 所属的业务主题、计算的方式、统计周期、限制条件、维度组合、字段定义等?
如果这个问题你答不全,那么你并不具备指标治理的意识(指标治理是数据治理中,与管理决策最为相关的部分),换个角度说,就是你还没有准备好使用数据。
可怕的是,若leader不能清晰地回答,那么下属、分析师、产品经理等角色,基本上对口径也是一笔糊涂账。 这样的结果就是:
  1. 管理决策从相对可靠的经验判断,变成依据不准确的数据进行推测; 虽然不能说这样的改变有多负面,但有些本优秀的决策者,往往被模棱两可的数据解读挤出自己擅长的领域,以更多的疑虑面对决策,会表现得更“依赖”数据结果,前瞻性决策的能力会变得平庸。
  2. 模糊的数据口径,给了“用数据说谎”、“用指标逃避责任”的空间,大大增加了组织的管理成本。 相对的,模糊的口径,也确实能带来一些“柔性”协作的效果,毕竟,任何组织里都有“和稀泥”的价值。
  3. 各协同部门之间,一旦涉及指标的应用,就一定少不了“对数据”,至少开4次“会”:
    第一次,暴露问题,拉群,越拉人越多,伴随各种推脱后,终于,最痛的那一方,万般无奈地作为owner;第二次,搞清楚“owner方”的数据口径;第三次,搞清楚“对方”的数据口径;第四次,确定到底谁的是对的,商量怎么办。 往往还有第五次,即由boss们来决定,怎么办
    这里的协同成本,十分可怕。

    ----分割线---

在上面文中,我抛出了以下两个观点:
  1. 数据治理,从业务的最初阶段,就要开始设计。
  2. 如果你不了解所使用的各种数据结果的口径,就不要推动所谓的“用数据说话”。
第二个观点换个角度说,就是数据的消费方,一定要有“数据严谨性”的意识,尤其当你是一个leader的时候。 第二篇中,我继续抛出一些观点。


  • 知识沉淀的健全与否,决定了数据治理的执行成本
数据治理项目,不仅需要深挖各种细节的业务定义,还需要有许多的“决断”(比如确定一版大家都能有共识的口径),需要协同的人,牵扯的部门往往很多。 我们先不谈人配合意愿的问题(许多时候,数据治理会触碰协作方的“安全边界”,这是一种寓情于理都可以理解的沟通障碍),我们假设所有协作方都无条件配合的情况下,仍然有极大概率出现的困难,那就是:
“谁都说不清某个关键的细节”
为什么呢? 因为知道的人已经走了,或者时间久了忘了,且没有历史记录沉淀下来。 在业务变化快,人员流动大的互联网公司,这种情况尤其普遍。


如何解决该问题? 道理其实很简单,就是加强业务知识管理; 但执行基本很扯淡,因为谁都不愿意“打杂”。 所以我有两个明确的建议:
  1. 每个有明确的组织边界的团队,都要建立《新人上手指南》,由公司HR部门全程监督: 内容制作详细且定期更新,每次更新发布,都由两个以上协作团队进行审核; HR跟踪部门新人对《新人上手指南》的评价,该评价计入该部门各层级的KPI考核中。
  2. 公司内部,从leader开始,应用任务协作和文档管理工具。 目前市面上的协作工具已经很多,私有部署的和saas模式都有,无论大小公司,都能找到适合自己价位的工具。 但心理预期要降低,工具的应用,并不能立马解决问题; 工具的应用,只是一个起点,能够使整个团队,开始建立知识管理和协作提效的意识


  • 我们可能正在透支整个社会的“数据应用能力”
这个观点在我脑中有段时间了。 出现的当时,我自己很诧异,但仔细想了想,也许这真的是事实。 为什么我们大力招人,却鲜有合适的人选? 尤其是高段位人才。 高段位固然是稀缺的,但稀缺的情况能够改善么? 目前似乎看不到好的信号。


首先,整个大的公共教育环境,对数据分析、数据科学人才的培养是非常滞后的 虽然近年来大力投入资源,但是一是起步晚了,人才补充到市场还需要时间。
二是培养方式不够脚踏实地 高校里,缺乏有实战经验的老师设计课程体系,导致“堆砌”理论,学生的商业感知和动手能力都不够好。 市场上的培训机构呢,基本上急功近利,拿入门级的知识当专业课,让学生挂几个“包”,跑几个“函数”,尝试几个kaggle案例,就收一笔学费,不论效果如何。


在这两个大背景下,我们大量的“用人单位”,只管招人干活,不管人的培养(许多都是自由生长,尤其是与上一个观点相呼应,当知识沉淀很差时,人才的成长更难达预期)。 在门槛越抬越高的情况下,公司内部的小伙伴却没有清晰的成长路径和辅导。那么结果就是,有一定工作年限的所谓的“高阶数据分析人才”,泡沫越来越大。 而正在努力的行业新人,却不能在正确的方向上,用合理的时间达到必要的高度。
“既然是泡沫,终究是要破灭的!
当泡沫破灭,所有人认清了现实以后。 国内的数据分析高阶人才市场,有可能出现信心危机。 极有可能造成“高阶大数据人才信任感缺失”的情况,市场信心的恢复,可要花点时间。 这与金融危机,是一个道理。
“以我个人招聘的经历来说(完全达到了大样本要求):数据分析领域,在正确的发展路径上的,3-7年工作经验是最有价值的。更长工作年限的人选,适配性可能不好,薪资要求也会偏高。”


回过头来,有资源,有能力的大厂,应该正视这个问题。 格局应该高一点,不管人才能不能长期留住,都要以“为中国经济发展,以自身业务场景为基础,培养数据分析人才。”为责任 踏踏实实分析现有的业务需求和人才成长模型,设计务实、分阶段、可量化、有积累效应的人才成长体系。
目前在数据领域打拼多年,资历颇深的伙伴们,尤其是处在团队管理岗位的伙伴,也应正视这个问题。 你们的未来,并不取决于你有多稀缺,有多少好的offer,这些都是暂时的。 好好培养身边的新人们,给予更多的引导和帮助。只有帮助他们提高,市场对“数据分析人才”的信心才能维持,整个市场的人才梯度更健康,才能挤压水分,消除泡沫。 从长远来看,才有利于行业内所有人的生存。


点击“原文链接”,查看作者原文!

END

转自: 老树之见 公众号;作者:老树

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

商务合作|约稿 请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

登录查看更多
3

相关内容

数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。数据治理是一种数据管理概念,涉及使组织能够确保在数据的整个生命周期中存在高数据质量的能力。一个数据管家是确保数据治理流程遵循,指导执行,并建议改进数据治理流程的作用。
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
专知会员服务
123+阅读 · 2020年3月26日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
【机器学习课程】机器学习中的常识性问题
专知会员服务
73+阅读 · 2019年12月2日
转岗产品经理,花了3个月都做不好需求工作
人人都是产品经理
10+阅读 · 2019年9月16日
【数据中台】什么是数据中台?
产业智能官
17+阅读 · 2019年7月30日
如何做数据治理?
智能交通技术
18+阅读 · 2019年4月20日
最好的激励,是激发员工的自驱力
华章管理
10+阅读 · 2019年4月14日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
数据工程师的没落
大数据文摘
4+阅读 · 2017年9月20日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Arxiv
101+阅读 · 2020年3月4日
Deep Co-Training for Semi-Supervised Image Segmentation
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
VIP会员
相关VIP内容
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
专知会员服务
123+阅读 · 2020年3月26日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
【机器学习课程】机器学习中的常识性问题
专知会员服务
73+阅读 · 2019年12月2日
相关资讯
转岗产品经理,花了3个月都做不好需求工作
人人都是产品经理
10+阅读 · 2019年9月16日
【数据中台】什么是数据中台?
产业智能官
17+阅读 · 2019年7月30日
如何做数据治理?
智能交通技术
18+阅读 · 2019年4月20日
最好的激励,是激发员工的自驱力
华章管理
10+阅读 · 2019年4月14日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
数据工程师的没落
大数据文摘
4+阅读 · 2017年9月20日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
Top
微信扫码咨询专知VIP会员