读书会•互联网
本文字数: 2400 阅读时长:理解着看
互联网er,阅读前,我们先思考以下问题:
产品经理对技术的理解要到什么程度?
如果微信想分析你,它比你还了解你。——沃·滋吉硕德
企业的数据库里留存了那么多用户的数据,用户的一切行为在数据库里都是可追溯的,可分析的。
如何利用这些数据做精细化运营?对于公司而言,首先,要建立本企业的用户画像。
如何建立?建立之前,我们来了解一下用户画像。
一、什么是用户画像
用户画像,即用户信息标签化,通过收集用户人口学属性、社会属性、消费习惯、偏好特征等各个维度的数据,对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计以挖掘潜在价值信息,从而抽象出一个用户的信息全貌。
举一些例子,可视化的图,更加直观:
上面是一种用户画像,还有别的形式,写PPT一般都这么干:
再看一个易观千帆给第三方企业做的用户画像服务,会收集哪些信息?
这张图,我建议你好好看看
当你详细看完这张图之后,你是不是会觉得,你在网上就是裸奔呢?
不要觉得你放在F盘里的隐秘文件,某些公司不知道。
不过,用户画像的核心目的还是为了解用户,通过分析不同用户个体、不同用户群体的特征,针对不同的特征人群推荐不同内容。
二、如何构建用户画像?
用户画像在不同的业务上,构建的方式不一样,也就是需要区分不同场景和应用模式。
不过,整体而言,用户画像建模其实就是为用户打标签。打标签分为三种方式:
统计类标签:是最常见也是最基础的标签,这类标签构成了用户画像的基础。比如,性别、年龄、城市、生日、消费水平等等
规则类标签:是基于用户行为及确定的规则产生,比如微博用户,自然月内,登陆25--28天的用户,叫高度活跃用户,而登陆满一月的,叫全勤用户。当然,这些规则都是产品经理或者运营来定的。至于什么岗位的来负责,根据公司内部情况而定。
挖掘类标签:通过数据挖掘产生,用于对用户的某些属性或某些行为进行预测。比如,微信会根据用户点击广告的情况,给用户推荐朋友圈广告。精准推荐之类的都属于这种情况。这种标签需要通过算法挖掘产生。
按照数据颗粒度以及应用场景可以分为三个层级:
明细层数据:以“日”为数据粒度,直接从各个业务数据表、日志数据表、埋点数据表抽取用户每天的每一次行为,按固定表结构插入相关表中,在此过程中不对数据做任何汇总、统计类的处理。可视为数据仓库中ODS(操作性数据)层数据。
统计中间层数据:以“用户”为数据粒度,对明细层的全量历史数据进行统计加工、汇总计算,可视为数据仓库中DW(数据仓库)层数据。
应用层数据:以“用户”为数据粒度,对统计中间层数据做进一步挖掘处理,处理过程中要考虑业务应用场景,关联行为权重、标签权重等。应用层数据输出后可支持产品应用。应用层数据可视为数据仓库中DM(数据集市)层数据。
三、数据库关系结构
这里再稍微解释一下ODS/DW/DM的关系结构,用这张图表示一下。
这张图是数据仓库的整理架构。
各个系统的元数据通过ETL同步到操作性数据仓库ODS中,对ODS数据进行面向主题域建模形成DW(数据仓库),DM是针对某一个业务领域建立模型,具体用户(决策层)查看DM生成的报表。
了解了这个数据架构之后,在数据层面,是如何实现的呢?
对于用户画像的应用流程来说,原始数据输入到模型应用可以分成5部分。
包括将操作型环境数据经ETL后集中存储在数据仓库,之后经过对数据的建模、挖掘、分析建立用户画像模型,最终将建好用户画像的数据接口调用到BI报表、经营分析、精准营销、个性化推荐等各系统模块。
数据产品处理的主要工作,就在画像主题建模这块儿。也就是结合需求方对画像应用场景的需求及数据仓库已有数据来构建用户画像模型。
这些词整的挺高大上的,其实,总归就是三个字:贴标签。
从应用角度来看,标签主要分为两大类:通用类标签和业务类标签。
从类型角度看,标签可以分为个人用户画像和群体用户画像。个人画像主要用户用户个性化定位,而群体用于对用户群体的定位。群体画像都是基于个人画像建立的。
四、建立标签体系
一套完整的数据标签体系,不是一两天能做完的。
开发出的用户画像相关宽表及明细标签表,按照应用场景一般分为用户人口属性画像、用户个性化标签、各业务线用户画像、用户偏好画像和用户群体属性画像等。详细描述如下。
用户人口属性画像
比如,你下载了个APP,注册账号,填写基本信息,姓名,性别,年龄等等。这都是人口属性。这种信息,对于时效性要求不高,比如性别,估计大多数人一辈子不会变。年龄,一年才变一次。
最终这些信息会形成一张用户宽表,包括了常见的用户属性,如图所示:
用户个性化标签
比如,你在网上搜索、关注、收藏、评价等等一系列行为,都会有相应的标签。根据这些标签的发生时间、行为次数、行为类型能够统计出用户与某些标签之间的紧急程度。在行为标签的基础上经过综合打分可以进一步挖掘出用户偏好的物品或内容。
用户个性化标签会形成一张用户行为标签表,这个标签表记录了用户在平台上发生的每一次行为的日期、类型及因此带来的标签,如图所示:
做个具体解释,以登录为例
标签id:比如登录,就是一个标签,这个标签存储在相关的业务数据表、日志数据表或者埋点数据表中,id可能是0000001
标签名称:就是登录
行为次数:比如,用户2019年5月5日登录1次。行为日期记为2019-05-05,行为次数记为1
标签类型:登录这个标签归属的类型,不同公司定义不同。
行为类型:包括各种各样的行为,浏览、搜索、登录、关注等等,不同类型的行为对用户的重要性不同,一般来说,复杂程度越高的操作,对用户意义越大。
各业务线用户画像
针对各业务线的业务特征,设计一套标签用户监控用户在该业务线上的操作行为。例如,针对feed流这里,可以以用户单击每一个题目的次数、看各个新闻的市场、看不同的标题等维度进行画像标签的设置。
用户偏好画像
在用户个性化标签的基础上,根据业务规则设,定用户各种行为类型的权重、时间衰减方式、标签权重,并通过基于物品相关的协同过滤算法建立用户偏好画像的数据表,如图所示
群体属性画像
对用户进行“群分”的过程即对用户进行聚类。一方面可以根据用户的性别年龄进行划分,另一方面可以根据用户购买频率、价格消费能力、行为属性进行划分。也就是把前面的几个画像归个类。如图所示:
看完这几个图之后,不知道你有没有感觉了,用户画像就是各种各样的标签。
五、DPM眼中的用户画像
如你所知,视觉化的画像,就是这样子的,你看到各种宣传也长这样。
其实,在数据产品经理眼里,画像是这样子的。
以上就是用户画像的介绍了,改天我们再写一个详细的案例。从头到尾如何建立的。不过,还是建议,如何想做数据产品,都是得懂技术的,以前不会,现在可以学。
-End-
觉得有启发,点个在看,转给朋友们
今天值班的小编是小白,欢迎你留言