文章作者:曹雷 滴滴 高级专家工程师
编辑整理:Charlotte
内容来源:公众号“滴滴技术”
01
什么是指标体系
1. 指标体系定义
指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。
指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。
指标主要分为结果型和过程型:
结果型指标
用于衡量用户发生某个动作后所产生的结果,通常是延后知道的,很难进行干预。结果型指标更多的是监控数据异常,或者是监控某个场景下用户需求是否被满足
过程型指标
用户在做某个动作时候所产生的指标,可以通过某些运营策略来影响这个过程指标,从而影响最终的结果,过程型指标更加关注用户的需求为什么被满足或没被满足
体系是由不同的维度组成,而维度是指用户观察、思考与表述某事物的“思维角度”,维度是指标体系的核心,没有维度,单纯说指标是没有任何意义的。
维度主要分为定性维度和定量维度,定性维度,主要是偏文字描述类如城市、性别、职业等;定量维度,主要是数值类描述如收入、年龄等,对定量维度需要做数值分组处理。
2. 指标体系生命周期
生命周期主要包含定义、生产、消费、下线四个阶段。针对整个生命周期要持续做指标运维、质量保障,同时为了提高指标数据复用度,降低用户使用成本需要做对应的数据运营工作。
3. 综合使用场景
指标体系主要是结合用户的业务场景来进行使用,多个不同的指标和维度可以组合起来进行业务的综合分析,用户可通过指标的变化看到整体业务的变化,并能够快速发现问题、定位问题。常用的场景一种是决策分析的场景,通过数据看清业务现状进行战略决策支持,另一种是运营分析场景,无论是做用户运营、产品运营还是活动运营都需要各类指标数据的支撑去看清问题、分析问题和指导解决问题。
02
衡量业务发展质量:
建立指标因果关系:
主要明确结果型指标和过程型指标关系,通过结果指标回溯过程指标,找到解决问题的核心原因
03
指标体系建设的常用方法是通过场景化进行指标体系的搭建,以用户的视角场景化思考,自上而下业务驱动指标体系建设,所以要在特定场景下做好指标体系建设,需要先选好指标,然后用科学的方法搭建指标体系。
1. 科学方法选指标
选指标常用方法是指标分级方法和OSM模型。
指标分级主要是指标内容纵向的思考,根据企业战略目标、组织及业务过程进行自上而下的指标分级,对指标进行层层剖析,主要分为三级T1、T2、T3。
T1指标:公司战略层面指标
T2指标:业务策略层面指标
T3指标:业务执行层面指标
T3指标是对T2指标的拆解,用于定位T2指标的问题。T3指标通常也是业务过程中最多的指标。根据各职能部门目标的不同,其关注的指标也各有差异。T3指标的使用通常可以指导一线运营或分析人员开展工作,内容偏过程性指标,可以快速引导一线人员做出相应的动作。
例如:成交率的指标分级
OSM模型(Obejective,Strategy,Measurement)是指标体系建设过程中辅助确定核心的重要方法,包含业务目标、业务策略、业务度量,是指标内容横向的思考。
O
S
M
这些策略随之带来的数据指标变化有哪些?
以滴滴网约车为例,按照OSM模型,它的指标是什么样的?
O:用户来使用滴滴这个产品,需求和目标是什么?
用户需求及目标是便捷、快速打到车,安全到达目的地
那如何让用户感受到自己的需求被满足了呢?
过程指标:渠道发单数、渠道完单数、排队乘客数、乘客排队时长、司机好评率、司机接单量、司机取消数等
指标选取之后,下面就是最重要的分析维度选择了,前面指标体系定义里讲过维度是指标体系的核心,没有维度,单纯说指标是没有任何意义的。所以维度选择层面主要通过数据分析视角结合实际分析业务场景来确定。例如城市维度、商圈维度、渠道维度、时间维度、用户标签维度等。
在《精益数据分析》一书中给出了两套比较常用的指标体系建设方法论,其中一个就是比较有名的海盗指标法,也就是我们经常听到的AARRR海盗模型。海盗模型是用户分析的经典模型,它反映了增长是系统性地贯穿于用户生命周期各个阶段的:用户拉新(Acquisition)、用户激活(Activation)、用户留存(Retention)、商业变现(Revenue)、用户推荐(Referral)。
AARRR模型
R变现
主要用来衡量产品商业价值。涉及关键指标例如生命周期价值(LTV)、客单价、GMV等
R推荐
衡量用户自传播程度和口碑情况。涉及关键指标例如邀请率、裂变系数等
可以根据实际业务场景,结合使用OSM和AARRR模型,来系统性的选择不同阶段所需要的核心数据指标。
"货"的视角
从"货"的视角,我们比较关心的就是成交了多少,交易额多少,花了多少,到具体数据指标主要会看GMV、成交率、取消率指标,在进一步会细分到城市、区域,一级品类、二级品类。数据的效果通过目标对比,横向对比、历史比较等方式进行分析确定。
"场"的视角
从"场"的视角,我们比较关心的就是哪个渠道用户点击量大曝光率大,带来了多少新用户,完成多少交易订单,客单价是多少;或者是哪个活动拉新或促活效果怎么样转化率多少,结合场景数据实际情况制定对应策略。
以上分别从"人"、"货"、"场"三个角度进行了数据指标和分析维度的提炼,下面我们把三类指标结合指标分级方法进行分解关联。
04
1. 痛点分析
业务视角
业务分析场景指标、维度不明确;
频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐;
用户分析具体业务问题找数据、核对确认数据成本较高。
技术视角
指标定义,指标命名混乱,指标不唯一,指标维护口径不一致;
指标生产,重复建设;数据汇算成本较高;
指标消费,数据出口不统一,重复输出,输出口径不一致;
产品视角
缺乏系统产品化支持从生产到消费数据流没有系统产品层面打通;
2. 管理目标
技术目标
统一指标和维度管理,指标命名、计算口径、统计来源唯一, 维度定义规范、维度值一致
业务目标
统一数据出口、场景化覆盖
产品目标
指标体系管理工具产品化落地;指标体系内容产品化落地支持决策、分析、运营例如决策北极星、智能运营分析产品等
3. 模型架构
数据域
指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不拆分的行为事件,在业务过程之下,可以定义指标;维度,是度量的环境,如乘客呼单事件,呼单类型是维度。为了保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护更新的,变动需执行变更流程。
指公司的业务活动事件,如,呼单、支付都是业务过程。其中,业务过程不可拆分。
用来明确统计的时间范围或者时间点,如最近30天、自然周、截止当日等。
是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖APP端、PC端等修饰词。
原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如支付金额。
维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季、月、周、日等级别内容)。
维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等都属于维度属性。
原子指标
基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如呼单量、交易金额
派生指标
是1个原子指标+多个修饰词(可选)+时间周期,是原子指标业务统计范围的圈定。派生指标又分以下二种类型:
存量型指标:
衍生指标
是在事务性指标和存量型指标的基础上复合成的。主要有比率型、比例型、统计型均值
技术信息对应维度的数据信息,由数据研发维护,主要包括是否有维表(是枚举维度还是有独立的物理维表)、是否是日期维、对应code英文名称和中文名称、对应name英文名称和中文名称。如果维度有维度物理表,则需要和对应的维度物理表绑定,设置code和name对应的字段。如果维度是枚举维,则需要填写对应的code和name。维度的统一管理,有利于以后数据表的标准化,也便于用户的查询使用。
衍生信息对应关联派生或衍生指标信息、关联数据应用和业务场景信息,便于用户查询指标被哪些其它指标和数据应用使用,提供指标血缘分析追查数据来源的能力。
建设目的:
对于用户:
对于研发:
利于后续指标生产模型设计、数据内容边界化、数据体系建设迭代量化和数据资产的落地
指标体系图谱实例:
05
统一对外提供标准的指标口径和元数据信息
指标生产
结束语
文章整体介绍了滴滴指标体系建设方法论和工具产品的建设情况,目前指标字典和开发工具已实现流程打通,与数据消费产品的打通后续会通过DataAPI方式提供数据服务,规划建设中。指标体系建设方法论和工具已经在滴滴集团内进行推广使用,滴滴网约车、普惠、车服等部门已经开始接入使用,截止目前共有5000+指标进入指标体系,覆盖公司核心业务板块、88个数据域、385个业务过程,52个业务场景,方法论和工具也会持续迭代实践。
滴滴云平台事业群滴滴基础平台部数据治理部-数仓团队负责公司网约车、出租车、顺风车、国际化出行业务的数据仓库的架构、规划、设计及数据内容产品的建设工作。支撑公司运营、产品、分析、战略、安全、体验等核心业务部门的数据决策分析,提供完整、可靠、高质量的数据服务。
专注数据仓库体系化建设,产品化数仓理念推广及实践者。
今天的分享就到这里,谢谢大家。
在文末分享、点赞、在看,给个三连击呗~~
会员推荐:
DataFun会员计划重磅发布!多重权益加持,为你筑就数据科学家之路!扫码了解更多:
文章推荐:
关于我们:
DataFunTalk 专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100场线下沙龙、论坛及峰会,已邀请近500位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章300+,百万+阅读,8万+精准粉丝。
🧐分享、点赞、在看,给个三连击呗!👇