6% 的水军刷了 90% 的量,脱完水的大明星究竟还有几分红?

2017 年 7 月 5 日 极客公园 江湖边


摘要:各大平台的假数据让广告主手中的不确定性增加了,艺人飙升的价码正被重估。


娱乐圈的残酷之处,在于把艺人当股票。

想象一下,在真实的影视行业中,你要面对这样的问题:

这个演员,今天看涨还是看跌?他在社交媒体上的影响力有多大、票房前景如何?现在团队接到了六七部剧,哪部能让他的商业价值最大化,也让广告主获得更多回报?

关于这些问题,这个行业以往看的是经验,但现在是数字,而且是分钟级变化的数字。

这跟互联网下全面的流量经济有关。爱奇艺大剧营销中心总经理袁嘉露用一个「四有标准」来观察一部影视作品是不是火,即「朋友圈有转发、微博上有段子、百度有指数、淘宝有同款」。

但在近两年的影视行业,热钱很多,也很混乱。拿电影举例,「2016 年估计投入在电影领域的资金超过 2000 亿,但 2016 年的票房却是 455 亿,这是一个比股票交易市场还可怕的数据。」艾漫数据创始人曹永寿说。

数据作假是彼此心照不宣的常识。因为「即使是假的,也需要好看。别人都刷你不刷,你就是最差的,投资人那里也没法交待」。

但广告主手中的不确定性增加了,流量艺人飙升的价码正被重估。大大小小的脱水公司应运而生,他们有的做出了独特的算法,有的建起「水军库」,还用上了人工智能。汪洋黑水中,他们仿佛一只只白帽,不断跟水军上演斗智斗勇的故事。


作假到底有多严重?

陈涛是德塔文科技的技术负责人,她和团队长期监测影视、艺人的各项指标,为客户提供相关决策参考。据她观察,仅在百度指数这一块,造假表现就已经千姿百态:

有每天几乎都一样高的『平台式艺人』;还有到了月底跌得厉害、续费以后又上去了的『峰波状艺人』;也有些人会做得比较好看,是一条弯弯绕绕的曲线。但如果你多看两个人并且长期监控,有时候会发现他们的曲线走势完全一样,因为买的是同一家公司的服务。

而另一家数据监测机构「艾漫数据」市场中心总经理王蓓则对极客公园称,现在可以说,没有不用水军的。「从全网社交平台的数据来看,6% 的水军刷了 90% 的量,集中在 TF-boys 和一些选秀出身的艺人上。大家关注度比较高的 EXO 归国四子也有,陈学冬也挺多的。」

在今年 315 这天,艾漫称自己「冒死发布一份脱水榜单」,做了一件得罪经济公司,让艺人打脸的事。(统计区间:3 月 1 日- 3月 14 日,来源:艾漫指数)

在「水军占比榜」、「最敬业水军」等几份榜单中,一些明星的水军数已经超过了总量的十分之一。且后台数据显示,「某当红小鲜肉,某日单天只用了不到 400 多个可疑 ID,就刷出了超过 17 万的讨论量」。

总之,根据他们的监测结果,我们看到的基本是个假的娱乐圈。

2016 年上映的《爵迹》曾以 3.6 亿票房扑街。「它当时至少有十个流量艺人,预测票房至少有十个亿的体量,但事实证明,每个人能够贡献票房的活跃粉丝没有那么多。」一位影视行业从业者总结道。

虽然票房不能完全和粉丝经济挂钩,影视作品是一门综合艺术,剧本、导演、演员、市场环境和造星体系都可以找到它自己的原因。但不可否认的是,这跟数据造假有关。

「一个稍微负点责任的乙方,手里一定有两到三家刷量公司或者个人的联系方式的。」上述影视行业从业者说。

据极客公园了解到的情况,从百度指数、微博热搜、微指数到各大榜单、网站评分、软文 PV、点赞和留言,甚至细到公众号文章统计口径中的「阅读来源」,没有什么做不了假。

不同质量、难度和规模的刷量对应花多少钱,这中间只是算账的问题。

对微博、爱奇艺、腾讯视频等各大平台而言,为数据「脱水」早已成为日常工作。但针对不同平台,水军有不同的「攻坚方法」。据爱奇艺 CTO 汤兴称,现在的作弊手段,可以通过大量云计算主机模仿人的行为去点击视频。

同时,他们也不得不面临市场环境的问题,以及纷至沓来的有关可靠性和利益相关的质疑。

豆瓣 CEO 阿北曾以《豆瓣电影评分八问》一文回应:水军是有的,但豆瓣评分很难刷得动……内部做到真正的独立比较容易,可以用结构、制度和防火墙做到。整个豆瓣系统里没有「修改电影平均分」的后台功能。

作假是一门成熟的生意,目前我国也并没有针对「刷量」行为有专门的法律规定。《好奇心日报》记者彭卡茜这样评论道:这是一个人人作恶,最后失去市场标准的故事。


脱水公司的靶心在哪里?

「其实所谓的水军,现在最典型的是在新浪微博。因为是营销重镇,所以水特别重要。然后是百度指数。别的地方也有水,但这两个是重点灌水的地方。」陈涛说。

「但百度指数灌水,除了做得好看之外是没有意义的,因为它就是一个数字,没有衍生价值。对于这种高,脱水是很容易的,因为百度是一个非常完备的指数,你可以通过一些细节、分层数据、趋势分析,找到作假漏洞。」

作为舆情集散地、娱乐风向标的微博,它的脱水份额通常要占到八九成。

王蓓表示,水军干活,是要在短时间内产生大的量,它不可能像正常人。7*24 小时抓取数据后,他们会「分析它跟普通的粉丝、网友在表达方式方面的一些差异性,同时要对数据做清洗和消歧。」

相对便宜的水军会使用重复或者类似重复的说辞。「虽然会稍有变化,但明显不贴合正常人的一种思维、长度、想法」。

还有「言论不相关」的,「使用同一套溢美之词,不停的排列组合」,但结果可能压根不是在评论某位特定的艺人,比如大量夸赞某个明显是演技派的演员「颜值高」。

这些 ID 被艾漫判定为水军后,就将进入「水军库」,机器也不会再计算他今后的发言。然而一旦作假的人开始走心,那就防不胜防了。

「一些比较贵的水军公司会盗取不常用的肉鸡账户发微博,而更高质量的水军是真实用户,他们受雇于某个水军公司去评论、打分,这样的就会比较难识别。」王蓓说。

在刷榜行动中,粉丝越来越成为一支不可忽视的力量。「超级星饭团」等追星产品甚至为粉丝们提供各平台的一键签到功能,包括百度贴吧、寻艺网新媒体指数、微博超级话题打卡等等。

但过于整齐划一的行动很可能是无效的。王蓓表示,「我们并不是要逮住水军,而是筛掉水军所营造出的数据上的虚假繁荣。我们打击的是『水军的行为』,即使你真的是一个很卖力的粉丝,但你刷出来的一些非正常的热度,我们就不计算在内了。」

如今,判定「何为水军」远比想象的难上许多。毕竟,真的有粉丝一天可以为偶像发上两千条微博,这到底是属于人类行为还是机器行为?追星族们可能对此有很大情绪了,认为这是正常的「粉丝文化」,但它在有关商业的度量中,真正价值几何?

豆瓣这两年的原则是,「所有能判断属于非正常评分的一概不算」,所谓非正常评分,包括了黑水军、白水军、粉丝团刷分,甚至包括豆瓣用户捍卫评分公正的「反水行动」。

德塔文团队的做法是,统计独立 ID 的有效覆盖范围,以及语料的丰富度:

「如果同样的东西都发到两千条了,你的东西还会有人看吗?这肯定是无效的。独立 ID 不管是发了一条还是一百条、一千条,我们就只认这个人的有效覆盖范围。通过他的社交链、感兴趣的人到底覆盖到多大的一个圈层,可以大概反应出他这个人潜在的辐射量。

我们分析一个演员在某一天的语料丰富程度,我认为这是评价它的思想锐度的一个重要指标。语料越丰富,它的思想锐度就越够。这种情况下,我认为这个 ID,或者这个艺人的可传播价值就越高。不管是好的坏的,起码它有足够的话题性,足够的聚焦点。

有些人他的数据做的很高,如果语料不丰富,它就和百度类似了,只是一个没有灵魂的数。」

但机器只筛除那些大范围的机器人流量,关于它的训练依然需要大量的人工盯梢。艾漫一支 20 人左右的编辑团队,就负责「把一些机器识别不出来的水军,再放到库里让它去学习,这样不停的在迭代。」


周冬雨、宋茜们的数据特攻队

微博承认正常的冲榜行为。真正担心自家爱豆商业价值的粉丝,少不了要为他们组建「数据特攻队」,为热度、搜索关联词、销售额,甚至其所属经济公司的运作能力操心。

比如周冬雨的数据特攻队,会强调「看到负面不要出于好奇心去点击」、「要点击净化过的搜索关联词」。宋茜的后援团相互提醒:签到需要重视起来,豆瓣评分是重中之重,「要多给其他的电影打分,账号和昵称可以隐晦一点,还没播的电视剧不要打分」。景甜特攻组则会「日常播报扎心数据」,自发统计各平台热度和战果。

他们中间还流行着诸如不要回复喷子的言论(正确的做法是让其「沉没」)、评论区控场能力要强、不要帮低咖位偶像带热度之类的准则。在自家爱豆有重大活动之际,还需要「多开几个小号,提前养养肥」。

在明星艺人日益被数字化的今天,粉丝团并不是单纯的崇拜或者冒粉红泡泡的少女心,而是一支支并肩战斗的队伍

这些粉丝的行为,可以影响到「提及数据」「主动搜索行为数据」,并间接影响到「媒体曝光数据」,它们组成了一个艺人的影响力指标。

王蓓认为,在艺人的商业价值衡量中,影响力指标只是一个比较大的维度。「另外还要根据关联词,考量他的口碑、角色、社会、个人、广告形象。比如口碑层面的角色好评率,正负面分纬度计算。这些数据中,有多少在谈论他的形象、演技、婚恋、公益、言行,每个纬度下面也有不同的口碑计算。」

在艾漫的观察中,流量艺人真正的活跃粉丝数还是和带货能力强相关的。这也是为什么广告商尤其重视粉丝的原因。

微博上有个叫「天鹅湖 RTEH」的号,是粉丝专门开了为吴亦凡代言产品「晒单」的。账号描述里这么介绍自己:其实我们只是有钱

但艺人的快数据(舆情表现)和慢数据(比如票房、收视、奖项、商业代言)完全需要分开看。「有一两个能带货的演员,也不能代表这个电影就真的能卖。这是两码事。」陈涛说。

「一个剧的拼盘就定了它的命。你还要看制作公司推货能力、主创团队、题材和现在主流题材的适配度、这个题材针对的分众和电影针对的分众的适配度、导演的历史业绩、演员拼盘、演员和题材的适配度、大众心目中的兴趣度,甚至还要看剧组的和谐度,因为很多剧实际上失之于人和。」

这一切依托于真正影响决策的数据之上。但无论如何,这个行业还没有建立起确定的标准。

前几年的影视娱乐业,热钱翻云覆雨,却碰了一鼻子灰,它暴露了影视行业对风险把控的整体不足。王蓓刚刚踏入这个圈子的时候,甚至发现「这个行业没有数据」,很多事情是拍脑门决定。

如今的资本已经慢慢冷静下来,影视业处在冷却和谨慎的档口。今日头条这样的技术公司也正在尝试用 AI 进行艺人选角,发掘更多的素人演员。数据建设这条弧线也最终会落到大家有没有好电影看、有没有好剧追这件事上。

脱水行为本身并不会上升到行业净化的高度,能够支撑它继续走下去的是资本对确定性的要求。毕竟最着急的人是广告主、剧组之类的利益相关者,对于一般人而言,它不重要,这个行业里的许多流量艺人,也都需要维持一种门面上的景气度,这给注水提供了空间。

王蓓表示,「水军公司一直在观察我们的算法。大家都是在动态的调整中。」要做好脱水工作,需要海量数据和非常强的大数据挖掘技术,而且必须在一个领域内深耕很久。

至于准确性和独立性,他们愿意等待时间去验证,同时也「需要在更广泛的艺人身上做更长时间的监测。」

娱乐圈也是造梦行业。数据有时候是残酷的,它消解了我们少年时期的纯情世界,无情地翻开这个悠久造梦行业的另一面。商业在这里成为度量一切行动的尺度,但这就是现代文明发展的本质。

路漫漫其修远兮。如阿北所说,「这确实是持续的、魔高一尺道高一丈的事情。」

编辑:蒋鸿杰

头图来源:LucianoLuz

本文由极客公园原创

转载联系 wangxue@geekpark.net



登录查看更多
0

相关内容

艾漫科技 北京艾漫数据科技股份有限公司是基于影视娱乐大数据,与影视客户一起,以联合运营的方式参与影视娱乐项目的投资立项、剧本策划、演员筛选等环节,同时向互联网用户提供娱乐社交平台服务,是一家致力将高新技术与创意文化产业相结合,以科技引领娱乐的创新型互联网公司,公司成立2012年,位于北京市朝阳区北辰世纪中心。
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
55+阅读 · 2020年3月4日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
刘强东清明节回湖南湘潭认祖,带给乡亲100亿“小礼物”
中国企业家杂志
7+阅读 · 2018年4月7日
“我今年36岁了,除了收费啥也不会!”
创业邦杂志
4+阅读 · 2018年1月14日
2017创业阵亡最全名单曝光,触目惊心!
今日互联网头条
5+阅读 · 2017年12月26日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
5+阅读 · 2018年4月13日
Arxiv
4+阅读 · 2018年1月19日
Arxiv
7+阅读 · 2017年12月28日
VIP会员
相关资讯
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
刘强东清明节回湖南湘潭认祖,带给乡亲100亿“小礼物”
中国企业家杂志
7+阅读 · 2018年4月7日
“我今年36岁了,除了收费啥也不会!”
创业邦杂志
4+阅读 · 2018年1月14日
2017创业阵亡最全名单曝光,触目惊心!
今日互联网头条
5+阅读 · 2017年12月26日
"AI+教育"是虚火还是风口?
数据玩家
3+阅读 · 2017年12月14日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
相关论文
Top
微信扫码咨询专知VIP会员