谁在「偷听」我们的隐私

2020 年 8 月 31 日 人人都是产品经理

关注并将「人人都是产品经理」设为星标

每天早 07 : 45 按时送达

不知道大家有没有这种情况,你跟朋友正聊到某种商品时,打开手机有可能就刚好会看见这个商品的推送,这时候会觉得是不是被自己的手机“监听”了;本文作者解释了在大数据时代下的这一情况,我们一起来看一下。


作者:半佛仙人

微信公众号:半佛仙人

原文标题:《她其实没有那么喜欢你》

题图来自Unsplash, 基于CC0协议

全文共 3962 字,阅读需要 8 分钟

—————— BEGIN ——————

前几天有人问我,说怀疑自己被监视了:他刚刚和朋友聊了几句玛XX蒂,一打开VX就看到一个玛XX蒂的五元代金券,你说这是巧合?这能忍?肯定是VX在监听他!

虽然这是个段子,但是“APP在监听用户”这个问题已经可以算是互联网都市怪谈之一:传播范围广,而且传的有鼻子有眼,好像事实就是如此。

我倒不能说这种怀疑不合理,毕竟精准推荐确实精准到像是在监视你;但较起真来,这些传说其实挺滑稽。

不是说大厂没有使用用户信息的这个需求,只不过对于大厂来说,窃听这个方法实在太不合算了。

做什么事情都要讲究一个性价比,窃听就属于性价比特别低的那种行为:成本高、不够精准、耗能大,随便就能被用户发现,根本不适合用来收集信息。

对商家来说,收集用户信息最终目的一定是要用,毕竟商家又不是偷窥狂,不可能只是出于对你的关心就每天研究你浏览什么网页。

收集信息要用来赚钱的,这就涉及到一个效率和准确度的问题。

收集信息如果准,“推送广告——转化——赚钱”的流程就能够跑起来;如果信息不准,推送广告就没得转化,也就没有钱赚,反而还会招来用户的厌烦。

如果冒着巨大“偷窥”风险录下来的声音不是用户对谈的信息,而是用户楼下的大喇叭日夜爆喊:“烤鸭烤鸭,正宗烤鸭!正宗烤鸭!”的声音,就会出现推送的误判。

手机一听,“烤鸭”这肯定是高频词啊,一定是用户想吃烤鸭了,赶紧推荐给用户;用户打开手机一刷,气到一口老血吐在屏幕上:“我天天听楼下卖烤鸭已经快烦死了,你还给我推荐?气死了,嘎嘎嘎!“

而且中国是一个方言很多的国家,口音特色较浓的方言已经是识别重灾区,一样的词在不同方言系统中的差别含义更是能逼死识别系统。

比如说系统监听,听到了一句“我充电宝掉了”,激动的推荐充电宝;看似是个完整的判断,但在不同地方,“掉了”是有不同含义的——一种是“不见了,消失了”,一种只是从桌子上掉到地板上,捡起来就行;遇到后面这种状况,你推荐充电宝,用户只会满头问号。

更别提持续在后台监听需要消耗的系统资源,常年开着这么大的一个后台程序,用户的手机必然变得发烫又卡顿;再一检查,是哪个程序悄咪咪的狂跑,当场就能抓出偷窥者,谁敢搞这样的长期监听?

如果真的要靠监听来收集数据,细想也不划算,因为监听了又不能本地做出判断,监听的数据得上传啊;把监听数据上传到服务器,不谈存数据的服务器需要花多少维护费,光这个上传流程就复杂到头秃。

总之,监听是个ROI极低的愚蠢方案,通过监听来偷听用户想要什么,既不精准又耗费资源;用这个方法来推广告,妥妥的赔钱啊。

排除了监听的坑,就有人开始怀疑是聊天软件直接监视了自己,一定是运营方在盯着自己的聊天记录,才会给出那么精准的推送信息。

不然为什么在VX上和对方聊过什么,转眼就能在TB上看到类似内容?

你先别激动,你想想:VX和TB都不是一家的,它们监视也监视不到一块去;早在2013年两位互联网巨头就拉黑了彼此,以至于到现在我们在两个平台上都没法直接跳转链接到对家去,如果要让VX和TB共享数据,世界和平也就不远了。

我分享一个数据给大家,在2018年VX超10亿用户的时候,VX官方数据表示,每天VX有450亿次消息发出。

你可以算算,每天你要在VX上面发多少沙雕表情包?说多少“嗯嗯”、“好的”、“么么哒”?让公司去分析这些带有大量冗余信息的聊天记录来给你推广告,是不是有点大海捞针的感觉?

用聊天记录来推送广告,数据处理费时费力费钱,企业怎么可能做这样费力不讨好,被抓到还要原地爆炸的事情?

我们只不过是大数据洪流里面的很小很小一部分,企业使用我们的信息,不是那么精细的。

精准推送是一种技术,而不是一种盗窃术。

大家都害怕阴谋,但现实中用的多的都是阳谋;以现在的技术能力,完全可以用正规手段达到精准推送的目的。

真实的广告推送逻辑核心在于归类,在于给用户打上不同的标签,比如这批人来自“一线城市”、这批人是“女性”、这批人“喜欢打游戏”;通过不断的数据匹配,形成一个一个群体行为模型,进而给各个账号打上标签。

媒体平台或者数据公司只需要对用户群体进行兴趣意向的分类,针对这些标签进行大范围投放,完全就能达到个性化推荐的目的。

在大数据里我们都不是具象的个体,只是被归类进各式标签里面的群体画像。

每一条广告的投放范围动辄上万,甚至是百万量级,也就意味着会有无数人和你收到了相同的广告。

之前有人问我,她感觉自己被监视,因为系统每天都给她推送“成人自考本科”的广告,她感觉自己如果没有被监视的话,为什么广告方会知道她只有专科学历?

但在我看来这就很滑稽,因为我也每天收到同样的广告,在我眼里那些广告就像“渣渣辉”一样,属于暴力刷屏型的广告,一点也不精准。

有时候你以为是大数据针对你,但是实际上这是一个“孕妇效应”,也就是我们所说的“幸存者偏差”。

每天的一万条广告里可能只有10条是推送给你的,这10条广告里可能只有1条和你今天聊到的内容有关联;但因为我们的注意力只被这一个广告激活,反向联想起自己聊过的内容,就很容易出现“怎么我关心的东西总是会出现在我面前”的错觉。

你觉得看到了和自己刚说的话题有关的广告是因果关系,但很多时候根本没有必然联系;广告方还是在不断海投,只是比以前更容易命中你了而已。

人们总是会觉得自己独一无二,但是地球上有几十亿人,划分人格类型却只有16种,相似的人比你想的多,在数据的海洋里你们只是同一个标签下的一个拥有共同消费习惯的群体。

广告方更在乎用户对什么更感兴趣,更在乎自己投出一个广告,能不能控制广告成本,提高转化率;而不是花心思监视你平时发了多少魔性表情包。

媒体平台的目的,是通过大规模的数据分析和人群洞察帮助广告主找到那一批对广告更感兴趣的受众;并不会、也并没有必要针对某一个人的隐私进行挖掘。

被营销都赶不上定制服务,这说起来挺魔幻的,又过于现实。

再退一步说,像阿里、腾讯这样的大公司,没必要,也不敢去监听用户。

论技术他们是中国顶尖,论广告效果同样也是行业领先。

它们自己就是行业巨头,饭碗辣么大,为什么要为了一点用户数据去冒险?

大家害怕,只是因为觉得不偷隐私做不到那么精准的推送。

但现行的法律规定已经对个人信息作出了相关规定,像阿里、腾讯这些大厂也都获得了ISO/IEC 27001信息安全管理体系和ISO/IEC 29151个人身份信息保护等多项信息安全领域最权威、最严格的国际认证,信息安全和隐私保护能力都与国际接轨。

担心大厂监听你的人生,确实没必要,他们有其他不违规的方法。

但是,这不意味着信息没有泄露,只不过信息泄露的方向并不在大厂这里,精准推送也不是隐私泄露的产物。

隐私泄露的直接产物是各种能爆出你详细信息的诈骗电话,而精准推送并不具备精准到个体详细信息的数据需求。

现在实现精准推送的主流方法,依靠的是程序化广告的力量。

这是一种行业通用、成熟地利用技术手段进行广告交易和管理的广告形态,它的核心是:在正确的时间和场景,通过正确的方式,将正确的商品展示到正确的用户面前。

程序化广告可以通过广告投放者的自有数据源或第三方数据管理平台,将人群特征进行批量分类,生成对应的画像和标签,但这些用户画像根本无法对应到真实世界中的某个用户。

广告主在不同的媒体平台上,通过组合多个人群标签来筛选目标人群,进行广告投放,如“一线城市、30-40岁、男性”;这样的一个标签组合动辄覆盖上百万人,根本不可能知道收到广告的你是张三还是李四。

而对规模足够大的公司来说,媒体平台自行收集的数据就足以完成这个分类的工作,监听、监视聊天记录都属于多余的行为。

互联网隐私泄露确实是一个严重的问题,尤其是智能手机刚爆发的那几年,滥用数据的事确实已经多到了影响用户的生活,当时以各种小贷为代表的扒通讯录APP把各种骚扰电话打到飞起。

后来国家连续出台法律法规,规范隐私问题,最早那批胆子大的数据大师大多已经在唱铁窗泪,还能在外面活蹦乱跳的,都很清楚自己什么能做什么不能做。

到这个时节还在搞用户隐私的生意,有一个算一个都是在搞违法犯罪的勾当。

大厂做公司是来赚钱的,既无必要铤而走险,成本上也不划算。

他们有更多方法可以变现,窃听用户、买卖用户隐私信息这种高风险低收益的事,根本没必要去做。

目前隐私保护这个领域已经得到了一定的重视,但是一些隐私黑产依然活跃在互联网的背面。

与其担心聊天软件会不会监控自己的聊天记录,给自己来个实时录音,更应该注意的是一些黑产的小手段。

当你在互联网上使用真名,没有给自己准备一个额外的手机号,在各种投票、调查、抽奖里填入自己的真实信息时,你的信息其实早已经泄露;那些你懒得删的验证码、银行通知、订单短信,都会在某个野鸡软件“申请读取短信验证码”的过程中泄露出去。

与其担心大厂盗窃数据,不如做好自己的信息保护——很多填表的场合其实没有必要填真实信息;很多快递本来也送不上门,直接写进快递柜更安全;检查一下权限,其实大多APP根本不需要授权短信,双卡双待的时代,比起工作卡和生活卡,生活卡和账号卡的配置更稳妥。

我们解决不了信息泄露,但我们最少可以让信息泄露的内容更少一些。

当然,不被骗的方法除了从不暴露自己,还有一个选择是打死都不掏钱,只要你不肯掏钱,广告推的再多也没有意义。

只要我足够穷,就没有人能够收割我。

—————— / END / ——————

▼ 喜欢请分享,满意点个赞,最后点「在看」 ▼

登录查看更多
0

相关内容

基于旅游知识图谱的可解释景点推荐
专知会员服务
90+阅读 · 2020年9月4日
专知会员服务
124+阅读 · 2020年8月7日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
专知会员服务
123+阅读 · 2020年3月26日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
基于差分隐私的地理社交网络发布
FCS
9+阅读 · 2019年2月22日
改了3次APP首页后,我的一些认知
从0到1
11+阅读 · 2019年1月13日
以美团外卖为例,理清红包设计的「套路」
NPDP产品经理资讯
8+阅读 · 2018年9月19日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
认识个性化推荐系统:从推荐算法到产品冷启动
人人都是产品经理
6+阅读 · 2017年9月15日
有了场景和画像才懂用户
互联网er的早读课
6+阅读 · 2017年8月26日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
基于旅游知识图谱的可解释景点推荐
专知会员服务
90+阅读 · 2020年9月4日
专知会员服务
124+阅读 · 2020年8月7日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
专知会员服务
123+阅读 · 2020年3月26日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
相关资讯
基于差分隐私的地理社交网络发布
FCS
9+阅读 · 2019年2月22日
改了3次APP首页后,我的一些认知
从0到1
11+阅读 · 2019年1月13日
以美团外卖为例,理清红包设计的「套路」
NPDP产品经理资讯
8+阅读 · 2018年9月19日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
认识个性化推荐系统:从推荐算法到产品冷启动
人人都是产品经理
6+阅读 · 2017年9月15日
有了场景和画像才懂用户
互联网er的早读课
6+阅读 · 2017年8月26日
相关论文
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员