推荐系统有什么危害？

2020 年 7 月 24 日 机器学习与推荐算法

嘿，记得给“机器学习与推荐算法”添加星标

来自 | 知乎

链接 | https://www.zhihu.com/question/385821370

编辑 | 机器学习与推荐算法

本文仅作学术交流，如有侵权，请联系后台删除

又到周五下午了，相信大家已经开始给自己放假了。那么利用周末的时间来看看关于推荐系统的一些主观看法吧。听了太多关于推荐系统的好处，比如增加用户体验啊，提高网站主的收益啊，缓解长尾问题啊之类的。凡事都有两面性，接下来让我们看看大家对于推荐系统危害性的讨论。

推荐系统有什么危害?

"推荐系统属于资本，不属于用户"。一本书上看到这句话，想到了这个问题。

知乎作者：弗兰克扬

大概在十几年前的时候，我旁听新闻专业的一门课，当时的海龟老师就在讲互联网时代信息传播的问题。

这位老师开篇先讲了一大堆大家都知道的互联网带来的好处，获取信息的渠道更多了，交流更方便了等等。

紧接着就说，但这种方便带来的却是许多人变得更狭隘了。

然后就用当时最热的论坛举例，说现在大家会以各种爱好聚集在一个论坛上，论坛上也会有各个版块，大家起初在一起交流，肯定是希望能看见更多的观点，听到不同的声音，但是大家本来就是基于某种共同的价值观，共同的认同聚集在一起的，在经过了初期的交流后，很快大家获取信息的渠道就会极度地同质化，大家每天看同样的媒体，关注同样的话题，输出同样的观点，然后再彼此表达认同。

这时候，如果有新观点输入，一定是和大家在价值观和认同感上有着一定不同的人带来的，他的观点和表达方式也一定会让习惯了之前氛围的人觉得有些不舒适，这时候有两个可能的走向。

第一，新来的这个人改变自己，融入大家。

第二，大家接受新来的，集体改变看法。

事实上这两种可能都不常发生，最常发生的是新来的这个拒不改变，然后被踢出群。

久而久之，互联网就变成了持有相同观点的人聚集在一起增加认同的地方，而交流的作用就会越来越弱，每一次交流都可能会引发出互相认为对方是SB的论战。

当然，推荐算法能够带来的影响的选择权其实还在于个人，每个人在信息的选择上都会有偏食的现象，比如我在当年在门户网站时代看体育频道新闻的时候，我会只看足球，甚至只看足球下面的英超频道，另外的一个体育明星我明明知道他已经很火了，走在大街上恨不得每个人都在谈论他了，但我仍然不想看他的新闻，因为我不喜欢。

但这并不妨碍我知道这个体育明星，因为人总会在别的途径去接触别的信息，每个人都是不同的，别人总会无意中聊起你不感兴趣的话题，而你又总会被动接收，是否构建了自己的信息茧房，其实选择权在于自己，人都是有自主意识的，这就像一个孩子在小时候可能全部听父母的，但在青春期，总会有一些叛逆的想法，当你被一种推荐算法喂饱了，你就总会好奇，外面还有什么更新鲜的东西。

知乎作者：低钠盐

人容易陷进自己的小圈子，或是说系统给你设计的小圈子，视野会变得狭隘，长期会导致无法接受新的观点。

其实相当于一个恶性循环，系统根据你的浏览倾向构建个人的画像，又据此给未来的你设计新的画像，如此反复，但基本上会收敛到一个稳定值，而稳定的系统是能抵御一定噪声的，也就是说哪怕你因某件事价值观受到了一定的冲击，最后大概率还会回到稳定值的。

可以看看西部世界第三季第三集里面Dolores和Caleb那一段，基本上就是推荐系统一个可能的终极形态，掌控整个世界的智能系统获得人的大致画像后，给每个人设计一条定制的人生路线，你认为一切是自我的选择，实际上是系统通过资源调度确保你大概率按设计的路线走下去。

Caleb(左)尚不知道自己命运的时候，系统已经通过历史信息的收集和未来资源的调度保证了男主死亡的时间(10-12年内)、地点(海边)以及方式(自杀)

突然发现一个很讽刺的点，推荐系统给屏幕前的各位推荐了“推荐系统有什么危害”，就好像人类在反思“人类有什么缺陷”一样，虽然当前仍处于弱人工智能的阶段，而且知乎的推荐系统极有可能只是一个坐在屏幕后的抠脚大汉（因为实在太糟糕了），但单是这个想法就让人毛骨悚然了。

知乎作者：YukiRain

有一天和一个学文科的发小聊天时说到这个问题，她认为，未来的历史书上或许不会对feed推荐有什么正面的评价，就像曾经人类刚刚发现放射性元素时一样，很多人对这个能够商业化变现的东西抱有很高期望，把放射性元素做成各种漂亮的首饰，忽视了它对人类长期带来的毒害。

技术上来说，相当多推荐系统算法假设用户的喜好与行为服从一个平稳分布，个人认为这个假设在现实世界应该是完全不成立的，从宏观时间尺度上来看，用户与推荐模型应该是互相影响的，所以我有一天晚上洗澡时曾经开过一个脑洞：

另一个问题在于推荐模型的评价指标，对于绝大多数平台来说，只要用户之间存在互动，极端言论与撕bi对线总是很容易成为平台的主流，谁的嗓门大谁就能够吸引更多的流量，而推荐系统中的模型选择几乎永远是以用户点击率、留存率等作为评价指标的，实际上也相当于给模型带来了inductive bias，让模型更加倾向于这些嗓门大的内容，很多时候人们发现，你花在社交网络的时间越多，你的负面情绪也就越多，其中道理当源于此。

知乎作者：张珺

我就不再提「信息茧房」了，而是想着重说下这之前的一个部分：推荐系统已经不可逆地改变了「信息」这个产业的生态。在推荐系统之前，「信息」的出口一定是一个多类信息的聚合体，报纸、广播、电视、门户网站皆如是。不同类信息间有受众多寡之分，但无内容高下之别，而推荐系统成功通过用户停留时间等指标，把不同类信息（以及娱乐）绑到了一起进行比较。

在进入下文之前，我想首先强调下与「信息」这个概念相关的两个点：

一是「信息」的生产从个体角度来说必然是不稳定的、不连续的，条线A连日大新闻，条线B无事发生，这再常见不过了。传统的「媒体」在信息产业中很大的一个作用，就是通过聚合多名信息生产者，把这种总生产量的波动限制在可控范围内，以维持定时定量的信息供给。而从受众端，想要消费信息，获得的也一定是这样一份信息的聚合体。

二是「信息」虽然天然具有娱乐效用，但信息就是信息，娱乐就是娱乐，其生产方式是泾渭分明的。衡量信息产品（一篇报道，一篇论文，或哪怕维基百科的一个词条）的质量，应该考虑其传递信息的效率如何，这是由其载体限制决定的。为此，我们往往需要客观性、真实性，部分情况下还需要时效性或全面性这些指标。而衡量娱乐产品的质量就简单了，差不多可以概括为投入产出比。

那么基于以上两方面的阐述，推荐系统做到的是：提供了近乎于不定时、不限量的信息，导致「信息的娱乐效用」的重要性，超过了「传递信息的效率」——前者堆量可以累计，后者不行，或者说后者本来就是个总量有限条件下的指标。与此同时，不同类内容之间出现了可比性——实际上也是「娱乐效用」这个东西可量化且可比的延伸。而对于信息生产者来说，这最简单来说就是KPI变了。之前「不稳定的、不连续的」的生产方式也必须要变，这样才能从个体层面上就实现稳定的输出。

那么接下来，对于要完成KPI的信息生产者来说，如果我重视「信息的娱乐效用」，又还要保持稳定输出，那为什么不干脆再进一步，生产「娱乐性的信息」呢？随着一批信息生产者逐渐想通并转行，新媒体时代到来。

这里就有个很妙的事了：对于生产端来说，说自己生产的是娱乐内容，这话是说不出口的。而对于消费端来说，尽管很多信息消费者本来就是为了「信息的娱乐效用」（更多的人则是根本分不清信息和娱乐的区别），但你要让他们说自己是在消费娱乐产品，这也是不合适的。双方在推荐系统下一拍即合，于是大批名义上是信息产品，实质上是娱乐产品的内容就被生产了出来。如果觉得这个概念不够直观，可以看下比如「青年大院」、「北美留学生日报」啥的，应该比较好懂。

如果这部分新增内容就明确自己是娱乐产品，其实也就该到此为止了，是一个「落后于时代的信息内容生产者败给了与时俱进的娱乐内容生产者」的简单故事。但由于它们的旗号还是「信息产品」，这事就还在变得更糟。简单来说，就是「信息」这个概念已经被污染了。你说自己是信息生产者，大众没有足够的能力和精力去区分你是在提供信息，还是在提供娱乐——这对于还保留着对「信息」产业传统认知的人来说，这极其伤人，但已经救不回来了。

川皇的口头禅FAKE NEWS是一个绝对该拿出来一提的例子。这里有两个层面，一是简单通过与娱乐混杂，消解信息的严肃性；二也是更重要的一点则是，通过娱乐性的方式，达到传递信息的目的——虽然这让人感觉很糟，但事实就是非常多的人分不清自己在消费信息产品还是娱乐产品。其实他们只是想看些东西让自己高潮（这些东西的生态位类似于P站），但偏偏还能记住一些有的没的，这些残留下来的内容还能进一步MAKE FAKE NEWS GREAT AGAIN，良性循环。

所以我觉得任何的「信息生产者」，乃至任何想高效获取信息的人，都会对混杂了信息和娱乐（经常统称为内容）的推荐系统抱持反感，如果不是的话则无妨。以一些知名的例子来说，我对抖音和快手没有太大恶感，因为它们本身的定位就是产出和消费娱乐内容；知乎对我来说实际也是一个娱乐平台，我有时候愿意相对严肃地写一些东西，其实也只是我个人的娱乐倾向而已。我不反感推荐系统在这些地方应用，毕竟大家玩儿就图个玩儿的开心。

当然另一方面的例子，也很好举，它已经并且还将在可预见的未来内继续危害「信息」这个概念。

知乎作者：浑沌七日死

我觉得推荐系统最大的危害应该就是，容易强化某个人的某个观点和逻辑

算法推荐其实是无害的，像头条系列的产品，都是算法推荐，你喜欢什么，就给你看什么。这个很正常，就好像人与人交往也会倾向于合得来，相识的，对拍的。

看文字，视频人自然也是去找自己想看的，这属于人性的认同感和归属感。

就像交往中，没有人会说：“虽然这个人我不喜欢，但是我觉得能够帮我扩大逻辑认同，所以我和他继续来往”

不合适的人始终都是不合适的。

互联网的内容也是这样，假如你看到一个观点不同的内容，你会下意识的皱眉，反对，不想看，随后点个X，然后继续去看系统推荐给你喜欢的内容。

假如你能够做到“和而不同，反也是对”，那么推荐系统其实就对你没帮助了。

以前的时候我经常看各种新闻的客户端，比如网易，比如凤凰，比如腾讯，当时对我最大的帮助就是“虽然某个编辑的立场我不认同，这个观点与我相斥，但是整个逻辑和讲述的事我是认可的”

可惜，后来头条出来了，所有的新闻软件都变成了算法推荐。

系统紧紧地抓住了我的看法，给我推荐我喜欢的，尤其是我的观点，越是偏激，系统越是能够投我心有所好，给我推荐我想看的。

久而久之，那段时间我真的以为全世界都是和我一样的观点。因为在网上我看到这么多的内容和我观点一致，那么多评论的人都和我看法一致。这不就是说明，我即世界嘛？

后来我才知道，这个就是推荐系统，他会把你喜欢的东西推到你身旁，让你看不到那些你看不到。

这倒不是说推荐系统不好，人会趋利避害，追求喜欢的，这个是无罪的。但是推荐系统会放大这些，让你逐渐自我封闭，只追寻你喜欢的，看不到更大的世界。

在知乎上，我关注的人其实有很多时候不同人立场是相反的，他们有的偏左，有的偏右，有的激进，有的保守。

每次我刷时间轴总能看到各种各样的言论，层出不穷。虽然他们观点相反，但是都有一个优点，那就是哪怕是以立场为标签，他们点赞推送到我时间轴的，都是内容不错的，能够扩大我的见识。

而且我经常看到他们为了一件事下场辩论，虽然从来没有说服过对方，但是我从中还是看到了一件事的正反面，不同的逻辑在比较。

举个最简单的例子，假如你是一张五颜六色的纸，赤橙蓝绿青蓝紫，什么颜色都有，你今天点了蓝色，系统给你标记了，明天你点进去你会发现，系统推荐里全是天蓝，海蓝，深蓝，淡蓝，你喜欢天蓝色，然后天蓝色里又给你不断地细化细化直到最终系统发现，你喜欢的是#66CCFF

好了，从此给你推送的内容只有#66CCFF。

然后你就在这里找到自己的认同感，归属感，并且会逐渐的认为，世界就应该是#66CCFF，什么红色，绿色，紫色都是傻子，喜欢其他的蓝色的都是异端

然后有天忽然有人告诉你，三原色是红、绿、蓝，你怒不可遏，什么三原色？世界只有一种颜色那就是#66CCFF

这就是推荐系统的危害。

不过话虽然这么说，但是这并不能说服其他人，因为每个人上网都是看看休闲的内容打发一下，这种观点的转移是逐渐化的。

就好像，我一般从来不在评论区和人争辩，偶尔只有熟人的时候会调侃两句，因为我懒得争辩，你说是，那就是，假如你能说出点有营养的东西，哪怕观点相斥，我也会去顺着你的逻辑思考。

可惜的是，目前的互联网环境，大部分人都是被逐渐固化了观点逻辑，认为自己就是对的，哪怕是要上脏话的“三字经”也绝不屈服。

所以我不否认推荐系统优质之处，它能够让人更加深入的去了解某一系列的观点，但是我认为目前这个浮躁的互联网环境，有很大部分的锅是要给推荐系统，它把原本应该是一体互联的互联网，切割成数量无限多的小方块，让每个人形成“圈养”一般。

等这部分在圈里习惯了观点的人一旦出圈，就会怒不可遏，因为他发现外面的人都是与自己观点相斥的人。

愤怒的人是没有思考逻辑的，它不会想着怎么说服你，因为在圈里，不需要说服，大家都是一致观点。在圈外，也懒得说服，直接开骂就往事了。

个人观点，仅供参考。（也别和我辩，你们可以看看我ID，大概就知道我是什么想法了。）

OK，看完了吧。该学习推荐系统还是要学习推荐系统的，技术无罪，产品无罪，有罪的往往是人类的思想。

喜欢的话点个在看吧👇

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【LinkedIn工程总监洪亮劼】浅谈工业级推荐系统，附36页ppt与视频

专知会员服务

31+阅读 · 2020年10月6日

【CIKM2020】推荐系统的神经模板解释生成

专知会员服务

34+阅读 · 2020年9月9日

基于知识图谱的推荐系统研究综述

专知会员服务

333+阅读 · 2020年8月10日

中科院信工所发布《深度学习系统的隐私与安全》综述论文，187篇文献总结

专知会员服务

103+阅读 · 2019年12月5日

南洋理工大学，深度学习推荐系统综述

专知会员服务

176+阅读 · 2019年10月14日

推荐系统（一）：推荐系统基础

菜鸟的机器学习

25+阅读 · 2019年9月2日

推荐算法的“前世今生”

新榜

6+阅读 · 2019年8月23日

我是怎么走上推荐系统这条（不归）路的……

全球人工智能

11+阅读 · 2019年4月9日

推荐系统概述

互联网架构师

8+阅读 · 2018年10月28日

电商们推荐的都不是想买的？看看亚马逊是怎么做推荐系统的

InfoQ

6+阅读 · 2018年3月4日

Less is More: Learning Highlight Detection from Video Duration

Arxiv

7+阅读 · 2019年3月3日

Graph Neural Networks for Social Recommendation

Arxiv

10+阅读 · 2019年2月19日

Multi-task learning to improve natural language understanding

Arxiv

4+阅读 · 2018年12月17日

Object detection at 200 Frames Per Second

Arxiv

5+阅读 · 2018年5月16日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

VIP会员