如何破解“千人千面”,深度解读用户画像|Xtecher 项目

2017 年 8 月 23 日 Xtecher 最in的科技媒体


作者|邹雨晗

编辑|陈光

网址|www.xtecher.com

微信公众号ID|Xtecher


User Persona


第一种用户画像(User Persona)是产品设计、运营人员从用户群体中抽象出来的典型用户:


在用户调研阶段,产品经理经过调查问卷、客户访谈了解用户的共性与差异,汇总成不同的虚拟用户;


在产品原型设计、开发阶段,产品经理围绕这些虚拟用户的需求、场景,研究设计产品用户体验与使用流程;


当产品设计出现分歧时,产品经理能够借助用户画像,跳出离散的需求,聚焦到目标用户,不再讨论这个功能要不要保留,而是讨论用户可能需要这个功能,可能如何使用这个功能等等。


例如某招聘类产品在调研阶段构建的用户画像(User Persona):



(图片引用自 https://www.clearvoice.com)


所以,这类用户画像(UserPersona),本质是一个用以描述用户需求的工具,它帮助不同角色在产品研发过程中,站在用户的角度思考问题。


在产品设计阶段和原型开发阶段,产品经理会较多地借助用户画像(User Persona)理解用户的需求,想象用户使用的场景。随着产品上线后不断迭代,积累真实用户,仅通过用户画像(User Persona)难以量化地评估用户需求,也很难通过数据证伪,不确定用户画像(User Persona)虚构的人物是不是真的目标群体。同时,真实用户群体也随时间推移变化,在设计阶段虚构的用户画像(User Persona)需要重新调研、设想。


User Profile


与此同时,我们也希望通过产品积累的用户行为数据,为产品运营提供更好的支撑,例如根据用户浏览记录向用户提供个性化服务。这就是本文着重介绍的第二种用户画像(User Profile)——根据每个人在产品中的用户行为数据,产出描述用户的标签的集合。例如猜他是男是女,生活工作所在地,乃至喜欢哪个明星,要买什么东西等。


随着“千人千面”等理念深入人心,在与许多企业客户的沟通中,我们希望客户更加清楚两种用户画像的差异。与第一种用户画像(User Persona)不同的是,用户画像(User Profile)的建设更加关注:


是否反应受众的真实需求:用户画像(User Profile)这个词的字面意义,是关注人口属性、生活状态等静态信息,但这些信息并不一定直接反应用户兴趣。产品更关注的往往是某用户“最近喜欢看哪类视频”、“准备买多少钱的手机”这样能帮助产品运营的动态信息;


时效性:用户的兴趣偏好随时都在发生变化,需要及时更新用户标签;


覆盖度:用户画像(User Profile)既要勾勒出用户感兴趣的内容,也要记录用户不感兴趣的信息,尽量多地满足产品运营的需要。但同时,除了人口属性等明确的属性外,大多数用户画像的正确与否是没有意义的。如“最近喜欢看搞笑视频”这个标签,并不表示用户下一次一定观看搞笑视频,因此执着于提升标签的准确度,不如设计出多更清晰描述受众需求的标签,更多时候我们注重提升用户画像的覆盖度,同时提供更细粒度的画像。


设计用户画像的标签体系


用户画像(以下均指 User Profile)一般通过标签体系落地,简单说就是你把用户分到多少个类里面去,当然,每个用户是可以分到多个类上的。这些类都是什么,彼此之间有何联系,就构成了标签体系。通常有两种思路设计用户画像的标签体系。


一是结构化的标签体系,这类标签可以直接从人口属性、物品信息等基本信息中直接得到,有明确的层级关系,如性别、省市、视频分类、商品分类等。



(图片源自 http://www.amazon.cn)


结构化的标签体系通常较为简单,一般可以直接通过用户的行为映射得到,例如根据用户的购买记录,为用户构建物品对应的结构化标签。但结构化标签往往粒度较粗,无法充分衡量用户的兴趣,例如新闻类 App 中用户阅读了一条关于某明星的娱乐类新闻,其实无法推断出他对所有娱乐类新闻感兴趣,也不一定只对该明星情有独钟。


另一种是非结构化标签体系,就是各个标签各自反应各自的用户兴趣,彼此之间并无层级关系。典型的非结构化的标签,如搜索广告系统中的关键词,或者阅读类产品中的文档主题模型(Topic Model),或者向量化的用户、物品 Embedding。


标签体系的建设一要便于使用,二要区分度明显。结合具体产品而言,在不同的场景下,对这两点的要求重点是不同的。最终在产品中选择哪些标签并没有明确的依据,还是需要充分了解到底是什么驱动用户使用产品。有效的标签体系,要能反应用户决定买什么、不买什么的逻辑与依据。例如电商产品中,以新闻频道的方法,为用户构建“财经、体育、旅游、…”这样的标签,虽然并不难,但也没多大意义。


用户画像行业实践


神策数据与国内某知名视频聚合网站共同建设视频推荐服务。该网站每天聚合全网的视频,向用户提供热门视频、视频检索等服务。网站已经积累了大量的用户和行为数据,围绕新、老用户的运营模型在发生着变化。


与传统的视频站点不同,短视频的运营特点有:


播放随意性强:短视频播放虽然是个高频、周期性强的娱乐应用,但单次观影时间短,用户选择随意性大;


热点轮换迅速:平台中不断加入新视频,每天的热门内容不断变化,网站需要发现用户潜在的兴趣点,向用户推荐新鲜内容;


场景驱动:场景是特定的时间、地点和人物的组合下的特定的消费意图。不同的时间、地点,不同类型的用户的消费意图会有差异。例如白领乘地铁上班,会关注当日的新闻热点;周末晚上在家,用户更喜欢点击娱乐搞笑视频。场景辨识越细致,越能了解用户的消费意图,推荐满意度也就越高。


随着视频资源的不断丰富和用户需求的多样化,如何准确向客户推荐视频,是该产品用户画像的一个基本目标。我们十分看重推荐系统中,推荐结果的可解释性,即让用户能感觉到每一条推荐视频的推荐理由。因此,我们构建用户画像也以观看场景和观看兴趣为主。


用户画像


我们考虑新用户和老用户两大类群体。新用户第一次进入 App,在这一阶段的运营目标以留存为主,主要向用户推荐近期热门视频。除了常规的设备信息、地理信息外,我们对用户了解甚少,可以通过猜测下列问题:


用户在哪里?


这个时段可能处于什么场景?


构建用户画像,进行场景推荐。这两种标签的获取较为直接,通过用户手机的地理位置信息和当前时段就可以得到。不同场景下,我们向新用户推荐不同的视频,例如:


工作日,7:00-10:00: 用户可能搭乘公共交通工具前往公司,乘车时使用 3G/4G 流量上网,时间较为碎片化,并且容易受到打扰而中断观看。通常,这个时段用户希望了解当天的时事、新闻。因此我们推荐短小精悍的热点新闻;


工作日,12:30-14:00:用户可能在公司午休,我们推荐娱乐、搞笑类的视频,目的性较弱,随意寻找符合自己口味的内容,但有可能因为午睡或工作,观影时间碎片化。因此,我们推荐视频时长较短,娱乐、搞笑类的视频,如 X 奇艺的“笑 X 来了”等;


周末,19:00-23:00:用户可能在家中休息,观看时间较为充足;使用 Wifi,速度稳定;这个时段用户目的性通常较强,例如看看 ”XX 歌手”、“XX 男” 等综艺节目的热门片段更新没有。因此我们可以推荐综艺节目、电影片花等,满足用户长时间放松的需求。


通过场景推荐的方式,我们在不了解用户兴趣的情况下,针对不同场景标签下的新用户推荐不同热门视频,满足用户需求。


而对于老用户,运营目标是提升用户体验,向用户推荐感兴趣的内容,能提高观影时长;结合场景推荐用户可能感兴趣的新鲜内容,能提高用户留存率。除常规信息、场景信息外,构建老用户的用户画像还会考虑:


用户在不同时段的兴趣点


用户是否喜欢探索新鲜视频


用户召回需求


对于第一类“用户兴趣标签”,可以通过视频本身的分类信息构建结构化的兴趣标签。


我们在实际处理中,将每个用户最近观看记录作为一个观影序列,通过 Item2Vec(《Item2Vec: NeuralItem Embedding for CollaborativeFiltering》, https://arxiv.org/pdf/1603.04259v2.pdf)产出视频的 Embedding 矩阵,并用 Bag of Words 的思想以每个用户的最近观看记录描述用户兴趣,得到用户 Embedding,作为用户兴趣标签。


通过用户兴趣标签,我们可以将用户兴趣融入前文描述的场景推荐中,例如在工作日的 7:00-10:00,我们根据用户兴趣,从热点新闻中筛选用户感兴趣的军事、财经等品类;在周末的 19:00-23:00,我们根据用户上周的观影记录,重复推荐相同的新一期的综艺类节目。


对于第二类“用户新鲜度需求标签”,我们通过衡量用户观影记录中,各影片之间的相似度得到。影片分类覆盖越多,或影片之间的向量距离越远,说明用户越喜欢探索新内容。


对于喜欢探索不同类型的视频的用户,我们会更倾向于从用户未观看过的分类中,抽取新鲜热门视频加入推荐排序结果中。


现在互联网产品的获客成本很高,神策分析可以通过多维分析的方式寻找用户流失的原因,同时我们也通过统计方法预测用户流失风险。


对于视频网站的老用户,观影习惯和场景通常较为固定,当用户最近一段时间内的观看频次显著低于过往,甚至没有打开 App 时,我们判定用户有流失风险,可以通过推送感兴趣的视频等手段,召回用户。


小结


短视频是一个高频、随意性强的产品,用户的观看行为受时间、场地等场景因素影响较大,需要对用户在不同场景下的观看行为做深入了解,归纳不同场景下用户个体需求、群体需求的差异,针对不同场景制定相应的推荐策略,这也是我们选择场景作为短视频产品用户画像的突破口的原因。


同时我们在构建视频推荐的用户画像时还面临如下挑战:


数据稀疏性:个人的观看记录相对整体的覆盖度是十分低的,不同的个体间重合度也很低。我们需要从这些稀疏的数据中得到个体、群体的兴趣标签。


用户兴趣变化快:用户的兴趣点随时间、热点变化,用户观看了几次关于某明星的短视频,并不代表第二天或未来用户会对他感兴趣。我们需要分别构建用户短期、长期的兴趣标签。


场景识别难:目前我们的场景识别以时间段为主,未加入地理位置信息,而后者能显著提高细粒度场景识别的准确度。


总结


最后,总结一下文中提到的两种用户画像。User Persona 可以帮助我们形象的了解目标用户的行为特征,作为我们判断用户需求的依据;User Profile 从用户行为中构建各种标签,在用户生命周期中不断刻画用户意图,辅助产品运营。


画像标签体系的建设是不断迭代的过程,例如视频产品中,新的视频、新的热门话题不断产生,不断地研究和调整也就必不可少。只有根据产品运营的目标,灵活调整标签体系,才能取得最好的效果。



如果您想了解更多用户行为分析产品,可以访问神策数据官网或关注神策数据公众号。

━━━━━

封面来源:  排版:陈光  校对:陈光

━━━━━

如果您有国内外科技行业新鲜资讯或独到见解,欢迎与Xtecher联系

微信:littlefish_forever

邮箱:xiru.duan@xtecher.com


Xtecher官网平台现开通认证作者,

有发稿意向的个人或媒体,可联系微信:junmabaiyi948


(添加好友请注明公司、职位、事由)

点击 | 关键词 | 查看对应内容

Xtecher 精品文章


 人 物 

大健康

人本健康 陈恂 | Haplox 许明炎

奇云诺德 罗奇斌 | 基准医疗 范建兵

哈佛医学院 George Church

推想科技 陈宽

智能出行

小鹏汽车 夏珩 | 奇点汽车 沈海寅

禾赛科技 李一帆 | PulsAI 刘万千


人工智能

快乐智慧 雷鸣 | 出门问问 李志飞

达闼科技 黄晓庆(上\) | Rokid 黄伽卫

驭势科技 吴甘沙 | 格灵深瞳 赵勇 

地平线 方懿 | 彩云天气 袁行远

车和家 李想51猎头 刘维

Face Think 杨松帆 | 中科视拓 山世光

深鉴科技 汪玉 | 越疆科技 刘培超

Kneron Inc 刘峻诚 | MINIEYE 刘国清

地平线 黄畅 | 三角兽 亓超

极限元 马骥 | NXROBO 林天麟

灵喵 韩龙 | 云脑科技 张本宇

创来科技 陈茂 | 轻客智能 庞琳

iPIN CEO杨洋 阅面科技 赵京蕾

蓦然认知 戴帅湘 | 地平线 周峰

Perceptln 刘少山 | Vinci 朱大卫

码隆科技 黄鼎隆 | 知觉科技 邹琪琳

钢铁侠科技 张锐 | 速感科技 陈震

梅卡曼德 邵天兰 | 艾米机器人 李友芳Novumind CEO吴韧 | 爱因互动 王守崑

Vizum 董霄剑 | 小鹏汽车 夏珩


虚拟现实

诺亦腾 戴若犁 | 大朋VR 陈朝阳

Ximmerse 贺杰 | Pico 周宏伟
焰火工坊 娄池 | HTCVR 汪丛青 

七鑫易维 彭凡 | 影创科技 孙立

所思科技 罗子雄 | 凌宇智控 张道宁

Dexmo 谷逍驰


大数据

中网数据 孙远根 | 昆仑数据 陆薇

永洪科技 何春涛 | 华农天时 温晗秋子

GrowingIO 张溪梦 | ThinkingData 吕承通
神策数据 桑文锋 | 海云数据 冯一村

佳格数据 张弓 | 普林科技 王储

Datatist 宋碧莲 | 职品汇 龚才春

星环科技 孙元浩 | 人才易 葛昊

科技谷 陈思恩 | 驿氪 闵捷


航空航天

零壹空间 舒畅 | 天仪研究院 杨峰


Fintech

数库科技 刘彦 | Ping++ 金亦冶

abc Fintech 杨永智 | 奇点机智 宋嘉伟

芥末金融 彭晨 | 蓝海智投 刘震

海鲸金融 丁华昆 | 资易通 盛洁俪

点融网 郭宇航


其他科技创业者
科幻作家 郝景芳 | Vinci 宋斯纯

禾赛科技 李一帆 | 诸葛io 孔淼

奥图科技 叶晨光 | 瀚诺半导体 张诚

51猎头 刘维 | 腾展科技 魏松祥

墨刀 张元一 | Phresh Amit

品类 唐十三 | 布比 蒋海

Plug and Play Saeed Amidim

集智俱乐部 张江 | NVIDIA 黄仁勋

NewGen Capital 张璐 | 纵目科技 唐锐Insta360刘靖康 | MORE Health甘伟杰



 特 写 


人工智能

禾赛科技,加入无人车大战

如果太太说“今晚请使用机器人吧”

奇点汽车强势启动智能驾驶布局

透视Rokid:两度斩获CES大奖背后

语音助手“小不点”可行吗?

人工智能:付不起的工资,抢不到的人巨头之争,无人驾驶尖峰对决

唇亡齿寒,人工智能一场艰难“拔河”

2016中国最具投资价值人工智能项目Top 100 

直播鉴黄:堵塞出口还是守护高贵

国内智能驾驶Top20

无人驾驶若干问题

渡鸦科技被百度收购的过程

NVIDIA向AI边界进军

阿里大帝国启动“NASA”计划

人工智能究竟怎么长“记性”

阿里云的“硬骨头”

吴恩达终于离开,没人感到意外

腾讯优图,AI隐形战队

国产阿尔法狗战胜日本高手

BAT齐谈人工智能

阿里云,打响智能医疗第一枪

冷扑大师,从博弈算法到人类未来

28岁的《攻壳特工队》描述的未来

专访CMU计算机学院院长Andrew Moore

阿里云,用AI让中国“制造”变“智造”

CMU走出的智慧建筑新模式

AI时代,色情江湖攻防战


创业群像

“买买买”狂潮下物流巨链的前生今世

类定律:1年成为1亿美元公司的背后

华强北困局:离席的人,守望的人

区块链创业者们:黎明之前的那一刻

不开源的区块链都是“耍流氓”

华人对冲基金鼎新资本

一下科技通往纳斯达克之路

Uber无人车发生严重事故被叫停

神测数据,帮企业“打好数据底子”

布本智能,做有价值的云头条

个推,第三方推送里的“丐帮”

李志飞:并非上岸,只是出海

个性化时代的阅读之殇

个性化定制,空气从此不再共享

鳍源科技水下无人机:探索海底新纪元

FaceThink推出AI测评系统

30+汽车大佬:究竟需要哪种自动驾驶

比亚迪:从603.62%到-28.79%,只是一步之遥

航空航天

“潇湘一号”科学实验卫星升空

融资逾亿,零壹空间与它的火箭长征


Fintech

智能投顾:理性更多,还是赌性更硅谷投资人:真正的AI还得再等等

toC or toB谁的终结,谁的胜利

安防专家总论勒索病毒


虚拟现实

Magic Leap:给科技创业公司耐心

IVLab用工业VR降低行业风险

AR/VR还会继续受投资人待见吗


如果你拥有高精尖科技创业项目,Xtecher将为你提供:

1.专业的科技人物特稿和视频拍摄

2.在Xtecher官网、APP、微信的全方位展示

3.最专业的科技圈投资人、政府资源、产业资源

4.创业企业品牌管家与PR服务

即刻扫码,联系我们。

微信号:Xtecher

关注未来的人

都关注了Xtecher


登录查看更多
4

相关内容

用户画像是真实用户的虚拟代表,是 建立在一系列真实数据(Marketing data,Usability data)之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差 异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
192+阅读 · 2020年6月29日
AI创新者:破解项目绩效的密码
专知会员服务
33+阅读 · 2020年6月21日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
298+阅读 · 2020年6月16日
专知会员服务
145+阅读 · 2020年6月15日
轻量级神经网络架构综述
专知会员服务
96+阅读 · 2020年4月29日
新加坡南洋理工最新37页《零样本学习综述》论文
专知会员服务
112+阅读 · 2019年10月20日
用户研究:如何做用户画像分析
产品100干货速递
44+阅读 · 2019年5月9日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
两套经典的用户画像
产品100干货速递
26+阅读 · 2018年6月19日
如何利用动态信息数据构建用户画像?
NPDP产品经理资讯
6+阅读 · 2017年10月11日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
教你 5 步画出用户画像
职人社
8+阅读 · 2017年9月13日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
4+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年3月19日
Arxiv
7+阅读 · 2018年1月31日
Arxiv
9+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年11月13日
VIP会员
相关资讯
用户研究:如何做用户画像分析
产品100干货速递
44+阅读 · 2019年5月9日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
两套经典的用户画像
产品100干货速递
26+阅读 · 2018年6月19日
如何利用动态信息数据构建用户画像?
NPDP产品经理资讯
6+阅读 · 2017年10月11日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
教你 5 步画出用户画像
职人社
8+阅读 · 2017年9月13日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
相关论文
Arxiv
15+阅读 · 2020年2月6日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
4+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年3月19日
Arxiv
7+阅读 · 2018年1月31日
Arxiv
9+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年11月13日
Top
微信扫码咨询专知VIP会员