蔡徐坤用户画像

2019 年 4 月 23 日 R语言中文社区

来源:挖数

作者:挖数


互联网行业经常会做用户调研,通过线下访谈和线上埋点等方式收集用户数据后,最终形成产品主流用户的性别、年龄、职业、喜好、城市等标签数据,这个过程称为“用户画像”。


如果蔡徐坤是一款互联网产品,他无疑十分的成功!


他的用户数达到2355万

这个用户数已经远远超过一些二线互联网app,比如世纪佳缘、珍爱网等。


他的日活跃用户数也很猛,平均每条微博有接近100万的点赞和评论,用户粘度极高。


商业价值也很高,虽然没有确切数据,但之前网上流传一份2017年明星收入排行榜,鹿晗位居第二位,年收入1亿8千万。


而目前蔡徐坤的百度指数已经远超鹿晗,按这个流量,他的收入很可能接近甚至已经超越当时的鹿晗。


为了对蔡徐坤进行用户画像,我爬取了他微博下边一万个用户的评论数据,经过统计分析,有以下的结论:


从性别上看,女粉占比拥有压倒性优势


另外1%的用户没有填写性别。


从年龄上看,粉丝占比最大的是1996-2002年出生的人,占整体人数54%


而其中又以1998-2000年出生的最多,占整体人数32%


蔡徐坤本人是1998年出生的,跟主流粉丝年龄相符。


从粉丝的地域分布上看,人数Top10省份如下:


蔡本人出生于浙江,籍贯是湖南,他的粉丝没有呈现这两个地方特别多的现象,记得之前分析过王俊凯和王源,他们的粉丝就以他们的出生地重庆居多。


粉丝人数Top10的大学是:

其中清北占到这部分填写大学的粉丝人数的3.6%


不过这并不能得出蔡的粉都是高学历粉的结论,因为填写了大学的用户仅占总用户的1/10,而大学越牛逼填写的意愿越高,因此这里才会呈现出各种清北的假象,实际是幸存者偏差。


粉丝的职业一栏,有接近5%填写了蔡徐坤工作室或者蔡徐坤旗下这样的标签。


23%的粉丝昵称里边包含有坤、葵或者kun,死忠粉的比例非常高。

(注:粉丝经常称呼蔡徐坤为蔡小葵)


在来源那里可以抓取到粉丝的手机型号,各大手机品牌的占比分别是

看来vivo找蔡徐坤代言还是有效果的,2018年中国手机市场份额上vivo在oppo和华为之后,而这里跑到了前面。


同时也看出华为和小米还是抓不住年轻人的心。


将粉丝的评论进行分词,词频最高的是以下几个词


把名词取出来,可以看到平常粉丝怎么称呼蔡徐坤,频次Top10的词是:


1蔡徐坤;2哥哥;3宝贝;4坤哥;5宝宝;6ikun;7cxk;8小猫咪;9崽;10帅哥


蔡徐坤最近真的很火,不仅在百度指数上碾压吴亦凡、朱一龙、鹿晗、TFboys等流量大咖

他起诉B站的新闻也在微博热榜和知乎热榜上连续霸榜好几天。


他到底是怎么火起来的呢?从百度指数上可以看出端倪。


在百度指数的关键词上输入“蔡徐坤”,时间范围选全部


可以看到他的搜索热度有4个节点


第1个节点是他开始被人知道的时候,时间是2015年6月,当时他参加《星动亚洲》时被媒体挖出曾是TFboys原成员的往事,只是后来因学业繁忙选择退团。


第2个节点是他开始爆红的时候,时间是2018年2月,当时参加《偶像练习生》并拿到冠军。


第3个节点是潘长江在录制综艺节目《王牌对王牌》时,误将蔡徐坤认成了李易峰,结果蔡的粉丝瞬间攻陷了潘的微博,各大媒体纷纷报道。


第4个节点,也就是人气最巅峰时,是他打篮球的视频在B站被大量玩梗的时候!


梳理了一下他的用户触达过程,大概是这样的

后面2个群体人数比前面2个多很多,特别是拥有全网最强玩梗能力的B站用户,可以将蔡的梗病毒式传播到全网。


其实这是好事,毕竟触达了更多的用户,可惜蔡的做法是各种声明和律师函。

这样做只会让黑粉更黑,且多了一个新的梗可以玩


其实他大可以学学Skr吴自黑


这样除了再上一遍头条,粉丝更喜欢他之外,还可以让很多黑粉转路人,甚至转粉!


所以用户运营真的是一门艺术!


——————————————

往期精彩:

登录查看更多
4

相关内容

用户画像是真实用户的虚拟代表,是 建立在一系列真实数据(Marketing data,Usability data)之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差 异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
167+阅读 · 2020年4月26日
【哈工大】基于抽取的高考作文生成
专知会员服务
37+阅读 · 2020年3月10日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
214+阅读 · 2020年2月21日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
115+阅读 · 2020年1月1日
用户研究:如何做用户画像分析
产品100干货速递
44+阅读 · 2019年5月9日
两套经典的用户画像
产品100干货速递
26+阅读 · 2018年6月19日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
思路+步骤+方法,三步教你如何快速构建用户画像
教你 5 步画出用户画像
职人社
8+阅读 · 2017年9月13日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
你以为自己真的了解用户画像?其实猫腻可多了
THU数据派
8+阅读 · 2017年7月12日
用户画像之用户性别识别
大数据杂谈
6+阅读 · 2017年6月24日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
9+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年11月13日
VIP会员
相关资讯
用户研究:如何做用户画像分析
产品100干货速递
44+阅读 · 2019年5月9日
两套经典的用户画像
产品100干货速递
26+阅读 · 2018年6月19日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
思路+步骤+方法,三步教你如何快速构建用户画像
教你 5 步画出用户画像
职人社
8+阅读 · 2017年9月13日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
你以为自己真的了解用户画像?其实猫腻可多了
THU数据派
8+阅读 · 2017年7月12日
用户画像之用户性别识别
大数据杂谈
6+阅读 · 2017年6月24日
Top
微信扫码咨询专知VIP会员