周末聊聊 | 为什么头条和抖音总能让你“停不下来”?

2019 年 3 月 17 日 三节课



文作者波波,三节课产品学院策略课程负责人。
今天是周日,我们来聊点好玩的。


3月12日 ,今日头条(字节跳动)七周年,创始人张一鸣说了一段话,让我记忆尤深:

“我们想象着头条的feed连着一根智能的天线,天线连着无边的信息海洋,每一刷,就会从海洋取回此时此刻此地你最感兴趣的信息。所以我们努力涵盖各种各样有用的信息,从新闻到图片,从三农到学术。

抖音也是如此,想象全屏的视频让手机变成一扇窗户,你透过这个窗户看到一个丰富的世界,抖音是这个五彩斑斓世界的投影,感觉非常奇妙。”


众所周知,头条的个性化推荐被很多企业歆羡,但是,头条真的做到了吗?



我的小侄女特别喜欢看西瓜视频,每次回家都会发现她拿着手机在看,我问她为什么不看电视,“电视还要换台,还有广告,西瓜视频里都是我喜欢的,叔叔你送我个这个玩具吧”她指着视频里的玩具这样说;

而在和可爱的吉力班班聊天时,我们也聊到了抖音,“工作日我都不敢打开抖音和头条,一刷半天就过去了,时间过得太快了,总觉得啥都没做”吉力苦恼的告诉我。


仿佛头条系的产品都有一种魔力,总让人停不下来。所以我也很好奇大家是否有过刷抖音或头条停不下来的时候?


带着对“我们想象着头条的feed连着一根智能的天线,天线连着无边的信息海洋,每一刷,就会从海洋取回此时此刻此地你最感兴趣的信息”这个愿景的好奇,这周,我对今日头条做了一下调研,以下分享给你们。


一.个性化推荐之实际体验


首先,我用两个手机以新用户的身份体验了下头条的个性化推荐(注:分别为Android和iOS系统,且此前未安装过头条)


在启动App时,我特别留意了下我们经常直接点同意的政策和协议。可以看到从这个协议开始,头条就已经开始收集大量用户信息作为个性化推荐的依据,此次不讨论数据安全,只分析推荐系统。


1.用户隐私政策解读:

使用任何app,启动之后都会遇到权限申请和收集用户信息政策,而头条收集的有点点点多:

1)设备信息:包括硬件信息如机型;

2)功能使用信息:发布动态,发布内容,发布时间和空间(地理位置)等;

3)互动行为信息:设备存储信息如通讯录,图文等;

4)搜索信息:搜索关键词与搜索结果反馈;

5)关联账号信息:第三方登录和第三方账号绑定;

······


如下图所示,感兴趣可以找来读一下头条的隐私政策,内容推荐策略该收集什么基本介绍看它就够了,预计5000+字。



2.使用体验:

如下图所示,安卓机很快读取了机型信息,推送了红米note7相关资讯(下拉总共2条),而苹果手机未见明显与读取信息相关的信息推荐。



随后我进行了安卓机狂刷科技频道内容(该频道电子设备相关信息居多)苹果7Plus狂刷财经频道内容(该频道股票和赚钱相关)在刷的过程中,发现多数内容具有标题党的嫌疑,两类频道大量充斥着“垃圾内容”:


👆财经、科技两个频道内资讯类型


👆经历一天刷新后的头条内容推荐


如上图所示,我们可以看到安卓手机上,由于之前阅读为科技相关的资源,所以展现的为大数据和手机类产品和锤子科技(罗永浩)相关资讯,和科技频道内容极为相似;

而在另一台苹果手机上,出现的是兼职和招聘相关信息可能与赚钱有关,而财经频道内容多为股市和赚钱资讯,所以会推荐出来,并且相同频道的内容也不相同(这里忘记截图了,感兴趣的同学可以自行对比一下)


但这就是个性化推荐吗?总觉得有点low或者说过于简单。


不死心的我在班级群里发动策略课程学员对头条的个性化推荐做了一次阶段性调研,于是有了数十份优秀的分析结果,而经过阶段性调研,对头条的推荐策略有了更深的认知,以下仅摘取两份分析结果,作为参考研究头条的个性化推荐。


特别说明:

在策略工作中,阶段性调研作为通用方法论,需要遵循以下路径和原则——

1. 定义理想态(定义用户和产品的最佳状态,比如用百度搜到了需要的信息,用滴滴打到车到达目的地···);

2. 对未达理想态状态进行抽样分析(未达理想态释例:头条没推荐感兴趣的内容,滴滴没打到车);

3. 优先级判断(对未达理想态问题整理改进并列出优先级,本文未涉及问题改进的优先级)。



二.个性化推荐——阶段性调研(1)

1. 评估对象:今日头条的文章详情页底部(评论区上方)「推荐文章」这个推荐模块的效果。

2. 调研环境

机型:iphone xs max 

手机系统:ios 12.1

今日头条版本:V6.9.4

是否登录:已登录,新用户

选取模块:【科技】板块

1. 找到理想态

首先,我们对理想态做一个定义,即:推荐感兴趣内容使用户发生进一步操作比如:点击阅读、阅读后评论、阅读后收藏文章、阅读后点赞、阅读后转发分享、关注作者等等。


接下来,我们来确认核心指标及拆解。

  • 核心指标:推荐文章的点击率,评论率,收藏率,转发率,作者的关注率。

  • 拆解如下:

推荐文章的点击率=点击文章的人数/展示文章的人数

推荐文章的评论率=发表评论的人数/展示文章的人数

推荐文章的收藏率=点击收藏的人数/展示文章的人数

推荐文章的点赞数=点赞的人数/展示文章的人数

推荐文章的转发率=转发的人数/展示文章的人数

推荐文章作者的关注率=关注作者的人数/展示文章的人数



2. 对未达理想态的情况进行抽样分析


  • 样本数据:针对【科技】板块找寻十篇文章,记录它们各自的推荐的其他文章,数据如下。



  • 结果分析:内容推荐不合理率为64.3%。



三.个性化推荐——阶段性调研(2)


1. 目的:调研今日头条文章详情页底部「推荐文章」模块的效果。


2.场景:用户在科技频道下,用户会优先阅读科技类文章,「推荐文章」模块也为科技模块下。


3. 定义理想态:为用户推荐想要阅读的文章内容(仅限科技分类下的推荐)


4. 对不理想态的情况进行分析

抽样分析:随机抽取10篇文章,并记录其下面推荐的文章作为样本并对其进行分析。


👆点击可看大图


如上图所示,通过抽取数据对50个推荐文章内容数据进行问题标注与问题分类,分为以下几个类别:

1)核心内容抓取不准确(2个问题)此问题占比6%;

2)抓取部分主要关键词,但推荐文章方向有误(6个问题)此问题占比14%;

3)推荐文章类别不符(32个问题对抽样数据分析发现在主文章推荐总会有一些生活、娱乐八卦类文章推荐。占比高达60%)此问题占比40%;

4)推荐文章质量问题和重复性问题此问题预计占比20%。


5. 问题整理



不出我所料,根据目前的调研结果统计,目前头条的个性化推荐并未达到理想化状态平均为60%,这个占比可以说是非常高。个性化推荐的实质推荐给用户感兴趣的信息,而每位用户的喜好不尽相同,这就需要机器具备强大的计算逻辑和能力,虽然头条已经积累了海量的数据,但想做到个性化推荐,任重而道远,仍需要不断的数据积累和推荐策略优化。


因此,张一鸣所说的“每一刷,就会从海洋取回此时此刻此地你最感兴趣的信息”,目前可能还存在于愿景,希望宇宙条能坚持初心,真正通过策略和算法的运作去推荐感兴趣的优质信息,毕竟相比两年前,我的感受彻底变成了“每一刷,无尽的垃圾信息,标题党倾泻而来”,这也是我卸载头条的原因之一。


最后,让我们回到文章开头的那个问题,为什么刷头条会有很大概率让你像吃了炫迈一样根本停不下来?

这是因为,头条有40%左右的推荐成功率来吸引你继续使用,占据你的时间。


虽然目前头条个性化推荐仍有不足,但也凭借其策略,已经积累了数亿用户,并且占据了多数用户的时间,并且,相比于其他相似内容平台的内容分发和推荐机制,仍然是宇宙条遥遥领先。毕竟在机器学习这条路上,只有把策略用好了,才能解决海量数据带来的复杂问题。


然而仅凭于此,字节跳动在一些板块已经无往不利,比如抖音,西瓜视频等。引发“头腾大战”的原因也可能是腾讯也发现了头条系产品的魔力,能够制造用户时间黑洞,两边都开始抢用户抢时间。


👆部分头条系产品布局


其实,头条做到个性化推荐一方面除了庞大的数据支撑之外,另一方面也需要一个神秘的群体持续发挥力量,那就是策略。


虽然策略目前在很多人眼里仍然是一件非常神秘的事情,但在一线互联网相关企业已经越来越受重视,也成为企业越来越需求的稀缺人才。

究其原因,是因为策略能够在企业追求更加精细化运作与管理的阶段,利用数据和算法高效解决产品问题,达到资源利用的最大化,以最低的成本去获取更高的收益,达到“四两拨千斤”的效果(头条的营收有兴趣可百度,这种速度业内少见)


如下图所示,从我们找到的部分字节跳动策略岗位招聘来看,仅2019年3月份在北京地区招聘数量就上升到34人,同比去年增加150%。


👆2019年3月份智联招聘部分数据展示


至于策略是什么,做什么,怎么做?欢迎感兴趣的同学扫描下方图片中的二维码了解一下~



最最后,友情提示一下,本文所获取数据和分析仅做参考。欢迎你在评论区留言,一起聊聊头条系产品带给你的感受吧!


———— / END / ————

作者:波波(三节课策略产品经理课程负责人)

编辑、排版:Hanxu


往期推荐



戳个在看,一起来看

👇

登录查看更多
2

相关内容

推荐系统的一种应用场景。
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
今日头条技术架构分析
互联网架构师
11+阅读 · 2019年8月19日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
抖音爬虫
专知
3+阅读 · 2019年2月11日
抖音完了!这次道歉也没用了
今日互联网头条
9+阅读 · 2018年7月2日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
你以为自己真的了解用户画像?其实猫腻可多了
THU数据派
8+阅读 · 2017年7月12日
Adversarial Metric Attack for Person Re-identification
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
13+阅读 · 2018年4月18日
Arxiv
3+阅读 · 2018年3月21日
VIP会员
相关VIP内容
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
相关资讯
今日头条技术架构分析
互联网架构师
11+阅读 · 2019年8月19日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
抖音爬虫
专知
3+阅读 · 2019年2月11日
抖音完了!这次道歉也没用了
今日互联网头条
9+阅读 · 2018年7月2日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
你以为自己真的了解用户画像?其实猫腻可多了
THU数据派
8+阅读 · 2017年7月12日
Top
微信扫码咨询专知VIP会员