大数据背后的无奈与焦虑:“128元连衣裙”划分矮穷挫与白富美?

2019 年 3 月 17 日 CSDN云计算

戳蓝字“CSDN云计算”关注我们哦!



者: 刘丹

 

我们通过卖东西收集数据,数据是阿里最值钱的财富。

——马云


春天万物复苏,沉睡了一个冬季的爱美之心呼之欲出,连衣裙在姑娘的心里发了芽,不过这次有些意外,它竟然在热搜里先火了一把。

 

最近,网上掀起了一个关于“连衣裙客单价低于128”的讨论,竟然有人说具备这种特征的女孩不适合用来当女朋友。连衣裙客单价低于128是什么梗?“连衣裙客单价”是在淘宝搜索“连衣裙”弹出的衣服单价,这是淘宝针对消费者的消费水平做出的“特殊定制”。而一个女生的“连衣裙客单价低于128”,则意味着她搜索的连衣裙价格都低于128元,间接反映了她消费水平低。

 


其实,这句话最早出现于某知名财经博主,于2019年2月24日中午发布的一条微博,指出“连衣裙客单价低于128”是爱计较的女生的特征之一,原文如下:在我们电商行业,找女朋友有一条不为人知的铁律。不能找淘宝好评率低于98%,滴滴低于4.8,搜索核心词连衣裙,客单低于128的。以上三条同时满足的人,难伺候。

 

如此扎心的搜索,让不少年轻人纷纷打开淘宝,迫切的试探自己在电商平台究竟占据什么地位,而自己到底是不是所谓的“低价人群”,面对朋友圈疯狂的晒单背后,大数据的落地实际案例再次呼之欲出,那么关于大数据算法的讨论也一度受到业内的关注。

 

1


账单背后:大数据的力量

 

我们通常会遇到这样的情况,在淘宝京东等电商平台中,当我们搜索一件物品时,系统将会自动推荐同类物品,这是大数据在我们日常生活中最贴近的例子。而在我们购买一件物品时,账单背后,同样离不开大数据的支撑。

 

账单背后是一组不可小觑的数据,首先,庞大的用户基数,在浩瀚的网络中留下了海量的数据;其次,巨额的交易数据,记录了消费方式的变迁;最后,强大的大数据技术支持,每一笔的数额、时间、交易类型、手段等都被清清楚楚地记录并分析。

 


通过大数据账单,使得购物数据可以较为清楚的展示消费能力与偏好、理财数据展示财力、缴费还款数据展示信用价值。更值得探究的是,当我们的行为被大数据所记录的同时,大数据账单也同样影响着我们的消费习惯与生活习惯,比如当系统经常推荐我们低价或者高价的物品时,我们也会不自觉得跟着数据作为;在比如当年度账单统计出来时,我们迫不及待的宣告自己是一个剁手党时,也许下一年你会更加沉浸在“买买买”的痛快之中;再或者当你看到自己超额消费决定摆脱月光族,于是将自己的收入放入金库或进行科学的理财。这一系列被大数据影响的行为,同样是数据带来的魅力。

 

而更深层次的看待用户账单,我们发现数据不仅可以分析个人的消费能力,同样可以反应全国各地的各种状况,比如,区域经济发展状况、不同社会阶层的经济能力、不同地域的消费习惯与理念。当数据累积到一定程度时,我们甚至可以直接看出哪个群体是投资主流、哪个群体是消费大军、哪里最有钱。当搜索一条连衣裙都可以占据热点话题时,它背后的数据与算法终要见天日。


2


数据背后:社会的焦虑

 

即使是日常生活中,我们也就能感受到大数据背后的力量。可是,我们再回过头看看“低价人群”这一标签,多么讽刺与无奈,既然有低价人群,那一定就有“高价人群”,从最近朋友圈汹涌的“晒图“浪潮中可见一斑,他们晒出的连衣裙价格不仅高于128元,甚至还会出现上千上万价格的推荐,这无疑不是一种炫富手段,从而彻底找到了自己的存在感和认同感。


那么,淘宝究竟有没有这样的规则,是否给用户打上过这样刺眼的标签呢?对此,淘宝方面表示,根本不存在128元这条线。淘宝负责算法人员解释道,个性化推荐的初衷是满足用户多样化和实时变动的需求。用户的偏好不是静态的,算法难就难在要满足用户多样化场景下的需求,以及购物的差异化需求。“淘宝的系统是建立在大数据、实时计算等复杂技术体系下的AI系统,是对用户多元化、动态需求的理解和预测,不是简单的标签逻辑。”

 

也就是说,单一的消费数据绝不可能支撑“算法”, 即便为某个个体打上标签也需要多个维度的研究,比如手机号、住址、性别等基础数据,购买类别、客单价、购物频次等消费数据,浏览商品的类别、浏览时长、对于淘宝直播等其他内容的偏好,这些数据,都可以勾勒用户行为,最终描绘出用户画像。

 

其实,这个热点背后最让人不舒服的其实在于,“连衣裙低于128元的低价人群”被称为难伺候的主儿。那么,好评率长期保持在100%的人群,就是可以当做女朋友的最佳人选了吗?从不差评、从不麻烦客服,这就是一个人可以得意洋洋的地方吗,甘愿放弃维权的机会,笔者认为也可以称为懦弱的表现啊。

 


的确,有淘宝卖家称一件低于100元的衣服,本身是不怎么赚钱的,但是如果遇到精打细算,反复需要售后的消费者,其消耗的成本,最后这笔交易就真的不赚钱了。算法将用户挑选并分类出来,最后打上标签,好让商家可以对用户进行判断。讽刺的是,“低价人群”通过这次事件,不断地想要提高自己的客单价,而“高价人群”肆无忌惮的炫耀着自己的成绩。大数据给出的逻辑,有时更是野蛮的。在人们不愿被打上“低价人群”标签的同时,同样显示出了大数据背后人们的恐惧与不安。

 

3


准确or失败 数据预测为什么这么难?

 

大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。

 

举一个很著名的例子,在美国调查超市里最好卖的馅饼(Pie)是什么?每个人都回答是苹果派。看起来美国人最喜欢苹果派,但通过对大数据的分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不必为了对方而妥协,选择大部分人能够接受的苹果派,当馅饼变得足够小,小到只够一个人吃的时候,大家才会真正选择自己喜欢吃的,此时,苹果派只能排到第四、第五的位置。



也就是说,有时候大数据给我们的这一冰山一角,在没有更加细致的数据做支撑时,结果往往是不够准确的,就像“128元连衣裙”这个数据一样,当搜索出连衣裙价格真的低于128元,难道真的说明我只配穿低廉价格的衣服,是所谓的“穷人”吗?结论当然不是,毕竟当我想买LV、GUCCI、CHANEL的时候,也不会在淘宝上搜索购买吧。

 

所以,大数据真的有那么牛吗?大数据最根本之处在于信息收集方式出现了重大变化与革新。大数据的出现与大量信息直接在网络呈现关系非常紧密。微博、天猫、淘宝、微信等等都直接产生了大量包括定位、消息记录、消费记录、评价、阅读等等殊为庞大的信息,可以说互联网企业都自然的带有数据企业的标签。不过如果我们从数据的源头看的更仔细一些,还是会发现,其实很多数据依然是有巨大的采集与归类的需求。

 

现在人人都说大数据,但其实大家说的是 facebook,twitter等站点上每天产生的信息,而真正有效的数据并不完全在网络上,要依靠原始的方法来收集。从“128元连衣裙”热点背后,我们发现,数据方面还有很多基本层面的问题值得我们去探讨。

 

4


隐私难界定 大数据也不是万能的

 

大数据将我们暴露在众目睽睽下,甚至给我们打上了各式各样的标签。在大数据下,隐私难以界定,监管就成了难题。数字时代,人们最关心的就是隐私问题,但是对于隐私的界定仁者见仁,比如当你开车去机场赶飞机,路上交通很堵,这时候地图软件恰如其时的提醒你另一条路更加顺畅,这样的提醒贴心便利,自然受欢迎。但是,假若此时你去的是一个不愿让别人知道的地方,那么同样的情境下,如果地图软件的提醒不仅会暴漏自己的隐私,还会带来极其不爽的体验;再比如,最近你想出去旅游,查阅了很多攻略,随之旅行社推送的度假信息,你是非常接受的。但是如果制药厂商发现你有艾滋病,向你推送艾滋病药,相信没有多少人会接受这样的推送消息。

 


所以,隐私是分场合的,但厂商很难清楚地知道消费者所处的时间位置等具体情况。数据算法让我们尽享便利与捷径,但随之尴尬有时也会不请自来,而关于隐私泄露更是人们最为在意的一部分,由于很难界定隐私,所以在监管方面,同样考验着监管者与业界的智慧。

 

综上,大数据技术为人类社会带来了新的机遇,但大数据绝不是万能的,在其价值被认同的同时,也不能被刻意的夸大,当我们盲从于大数据,就容易产生片面错误的分析。首先是结果的不确定,其次是逻辑无规律,最后大数据是对过去已发生的事件进行经验总结,本身不具备创新性。这也就不难理解《流浪地球》预测10亿票房,却飚升到50亿,以及平时购买过LV的消费者,也在网络中搜出来128元连衣裙这样的事情了。所以,大数据为我们的生活带来了巨大变化的同时,切记盲目屈从与它。




福利

扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!



推荐阅读:


喜欢就点击“好看”吧
登录查看更多
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
专知会员服务
114+阅读 · 2020年6月12日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
专知会员服务
123+阅读 · 2020年3月26日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
142+阅读 · 2019年10月10日
2019互联网医疗行业洞察
行业研究报告
8+阅读 · 2019年5月28日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
知乎破8万赞回答:那些厉害的人,思维方式比你强在哪儿?
李善友:战略听着空?但有人用它“绝处逢生”
互联网er的早读课
10+阅读 · 2019年1月15日
招行高端卡套路深!“理财办卡”坑了多少人?
凤凰财经
3+阅读 · 2018年12月30日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
Arxiv
3+阅读 · 2018年10月25日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
4+阅读 · 2018年6月1日
VIP会员
相关VIP内容
专知会员服务
114+阅读 · 2020年6月12日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
专知会员服务
123+阅读 · 2020年3月26日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
142+阅读 · 2019年10月10日
相关资讯
2019互联网医疗行业洞察
行业研究报告
8+阅读 · 2019年5月28日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
知乎破8万赞回答:那些厉害的人,思维方式比你强在哪儿?
李善友:战略听着空?但有人用它“绝处逢生”
互联网er的早读课
10+阅读 · 2019年1月15日
招行高端卡套路深!“理财办卡”坑了多少人?
凤凰财经
3+阅读 · 2018年12月30日
从代码到300优质客户,用户画像在销售的实战应用
R语言中文社区
5+阅读 · 2018年6月16日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
看完后,别再说自己不懂用户画像了
R语言中文社区
15+阅读 · 2017年8月28日
Top
微信扫码咨询专知VIP会员