你的新闻 App 被推荐算法「毁」了,但 RSS 真的能拯救你吗

2018 年 4 月 11 日 少数派 Platycodon

最近,《连线》杂志网站上刊出了一篇题为《是时候让 RSS 复兴了》(It’s Time for an RSS Revival)的文章。文章开篇便动员道,「Twitter 让你心累了吗?Facebook 让你厌倦了吗?是时候回归 RSS 了。」之后,作者介绍了几个主流 RSS 服务的功能,采访了它们的负责人。文章认为,RSS 最吸引人之处,就在于它能让你看到「开放互联网未经过滤的样子」,给你一个「自己决定看什么」的机会。

有意思的是,尽管文章叫做「是时候让 RSS 复兴了」,作者却并没有点明这个「时机」是什么。当然,即使不说,大家也都摸得到房间里的那头大象——Facebook 最近被翻出旧帐,因疏于控制第三方开发者的权限,让一家有政治背景的咨询公司 Cambridge Analytica 得以从 Facebook 套取数千万用户的偏好信息,用于在 News Feed 中向用户精准投放内容、从而影响其政治选择。

这篇文章发表后成为了热文,不仅在 Twitter 上收获了不少点赞和转发,很多博客作者也纷纷转载支持。在 Hacker News 上,这篇文章的链接下产生了接近 500 条评论。究其原因,过去一两年中,公众对 Facebook 赖以安生立命的算法推荐积累了太多负面情绪,这次的数据「泄漏」事件只是压塌舆论大堤的最后一根稻草。跟乌烟瘴气的 News Feed 一比,简单干净的 RSS 当然堪称人人称道的一股清流。反观国内,算法推荐的最近的日子也不好过。即使不点名,大家也知道目前最招质疑的几个 app,都是靠算法推荐吃饭的。在《复兴》一文作者的笔下,RSS 正像是算法暴政中一片令人向往的绿洲。

我大概有资格自称为一个 RSS 的重度用户,几年来一直坚持把 RSS 作为自己最重要的信息获取来源。App Store 上主流的 RSS 客户端工具,我基本都尝试和对比过;Google Reader 以降的各种 RSS 服务,我也先后使用过很多,还曾为其中几种付费。现在,我放在 DigitalOcean 上一台 VPS 服务器的主要职能,就是运行一个自建的 Tiny Tiny RSS 服务端,配合移动设备上的 Fiery Feed 阅读 RSS;这台服务器的剩余性能则用来运行 Huginn,帮我爬取一些不支持 RSS 的网站(包括微信公众号),输出到 RSS 中阅读。

笔者的 Tiny Tiny RSS

但即使自己对 RSS 如此依赖,我仍然不认为它就是应当被「复兴」的,更不认为它可以被当作针对算法推荐带来诸多问题的解药。

首先需要检讨的是,RSS 究竟是什么?与算法推荐的本质区别何在?几乎所有介绍 RSS 的文章——《连线》这篇也不例外——都会指出 RSS 的全称是「简易内容聚合」(Really Simple Syndication),是一个能让你在一个地方订阅各种感兴趣网站的工具,但解释也就到此为止了。对于一个从未听说过 RSS 的读者来说,很难相信这样的介绍能让他们理解或感兴趣——哪一个主流的资讯阅读工具不能把用户感兴趣的内容聚集一处呢?

我们不妨啰嗦一点,从头梳理一下 RSS 的工作机制。如果一个网站支持 RSS,就意味着每当它新发布一篇新文章,就会往一个位于特定网址的文件中,以特定的语法(具体而言是 XML 标记语言或 JSON)增加一条记录,列明这篇文章的标题、作者、发表时间和内容(可以是全文,也可以是摘要)等信息。

这样,用户只要搜集所有他感兴趣的网站提供的这种文件的网址,并不时检查这些文件内容的更新,就能知道这些网站是否、何时发布了什么内容。RSS 阅读器的核心功能,就是存储用户订阅的 RSS 地址,以固定的频率自动检查更新,并将其内容转换为易读的格式呈现给用户。

一个典型 RSS XML 文件的结构

RSS 本身具有的功能就是这些了,但这恐怕还是很难说服人去使用。有谁会觉得把一群网站的文章堆在一起是种好的体验呢?的确如此,这就是为什么「现代」的 RSS 阅读器为了增强可用性,都不会囿于 RSS 那屈指可数的几个属性,而必须提供文件夹、标签、过滤器等功能,允许用户按照文章的话题、关键词、热度等属性来进一步整理、排序和筛选。有些阅读器为了增强用户黏性,还会提供部分文章推荐和社交功能。

等一下,这不就是算法做的事吗

没错,RSS 和算法本是殊途同归,都无非是获取信息的工具。它们的存在是为了解决同一个问题:如何从无限的信息中筛选出最有用的那些。严格来说,要判断一则内容是不是对自己有用,唯一的方法就是把它看完。在此之外,诸如标题、梗概、简介、推荐等所有元信息(metadata),都不能准确地反映有用程度。但在有限的时间和精力下,逐一检验显然不现实;因此,人们又不得不用这些元信息或其加权组合作为内容价值的拟制

两种进路的分歧之处就在于此:(原教旨的)RSS 是用文章来源和发表时间作为其价值的拟制,它假定 (a) 之前产生过有价值内容的信息源会继续提供有价值内容,和 (b) 时间越近的内容越可能有价值;而算法推荐是用与浏览历史的相似度来拟制信息价值——与之前看过的内容越类似,就越有价值。

但实践中,这种分歧早已模糊了。RSS 那种纯粹的无为或许是技术伦理上的清流,但一定是用户体验上的灾难,因此活下来的 RSS 产品都在功能上或多或少借鉴了算法阵营。另一方面,算法在判断相似度的时候,也不可能不考虑来源和时效性。因此,空泛地呼唤 RSS 的复兴是没有意义的——你只是在呼唤一个失去了对象的能指。

Inoreader 在 Dashboard 上提供的筛选和推荐功能

当然,RSS 和算法也有另外一些区别,其中被拿出来说事的最多的,大概是两者一个透明、一个是「黑盒子」,一个完全自治、一个受制于人。但这并不能必然导出 RSS 有益而算法作恶的结论。要判断 RSS 是不是真的比算法更好,还要看它们究竟会对使用者造成怎样的影响

目前,对算法主要抨击来源于其引发的两大问题:

其一是所谓的「回音壁」现象,即算法为了增强用户黏性,会迁就后者的喜好,不断猜测和推荐符合其立场和偏好的内容。这可能使用户接触的内容越来越狭窄,并强化其固有的偏见,因此是不健康的。这是事实,但 RSS 也不是问题的解药。在 RSS 中,每一个订阅源都是需要手动订阅的,这所需要的时间和心理成本远远高于从算法推荐的信息流中随手点开一篇文章的成本。显然,任何人都会倾向于订阅符合自己兴趣和立场的站点;很难想象会有多少人「捏着鼻子」强迫自己订阅厌恶的内容。反倒是算法推荐有时出于纠错、试探等目的,会不时在推荐内容中加入一些「噪音」,刻意推荐一些与用户此前体现出的喜好有所差异的内容;这也为人工干预算法以缓解回音壁效应提供了可能。而在 RSS 上订阅什么则只能由用户自己控制,相比之下在构建偏见方面的问题反而更大。

其二则是「信息过载」的问题。算法推荐常常被诟病的一点就在于它所采用的「瀑布流」模式:无穷无尽,刷完一屏,马上就会生成下一屏内容,让人难以自拔。由此观察,似乎问题的症结在于内容数量的无限性。但只要对 RSS 的相关讨论稍微有所了解就会知道,即使 RSS 上的内容是可计数的(事实上大多数 RSS 阅读器的界面设计都在强调这个数字),其造成的信息过载问题也丝毫不逊于算法。这是因为随着使用时间的推移,用户倾向于不断添加新的信息源;如果同时又疏于清理,很快就会发现自己每天都收到数以百计的新资讯,却无暇阅读。看似「有限」的未读数量逐渐堆积,引发巨大的压力和焦虑,最终导致资讯阅读系统的崩溃。相反,算法生成的信息流如果堆积起来,反而更容易让人「破罐破摔」,「大不了不看了」,放弃的心理成本相对较小。

一句话,算法推荐会导致的问题,即使换用 RSS 一样不能幸免,甚至可能更加严重。归根结底,这些问题的真正成因都不在于工具,而在于我们自己。人类天生有期待认同、排除异己的倾向。回音壁或许是技术建起来的,但终究是人自己躲进去的。信息摄入成瘾则是相对于资讯爆炸进化不足的体现。既然人类在物质过剩的今天,仍然无法摆脱对淀粉和脂肪本能的生理渴望,有什么理由能指望他们在面对信息过剩时,就能轻易跳脱「多一份信息、多一条活路」的狩猎思维呢?

毋须讳言,无论如何鼓吹 RSS,对于大多数人来说,RSS 就是比算法推荐难用。这种难用首先难在技术层面。暂且抛开挑选客户端、设置过滤器这些极客津津乐道、普通用户一头雾水的概念,哪怕只是搜集订阅地址这一最基础的操作,就足以构成很多用户无法逾越的障碍。如果《连线》杂志那篇文章的作者是针对中文群体写作,他一定不敢一边推荐,一边告诉读者如今想用 RSS 看微信公众号需要用到爬虫,否则他的 RSS 怕是没有复兴的希望了。

RSS 之难还难在需要风险自担。是的,它透明、纯粹、自由;但自由越大,责任也越大。如果一个人因为依赖算法推荐的文章而变得沉迷或偏激,他可以责备算法的不完备和邪恶;但如果一个 RSS 用户遇到同样的问题(我们已经证明这一概率并不低),他能责备的只有自己——每个订阅源都是他亲手添加的,每个话题都是他自认为有价值的。

用 RSS 订阅微信公众号需要复杂的配置

当然,从某种程度上来说,RSS 的这种高使用门槛正是它的魅力所在。选择了 RSS,就意味着要强迫自己控制信息源的数量和质量,并压制过度摄入信息的欲望。这种与自我的搏斗不仅是对自制力和判断力的锻炼,也能让人不断摸清自己的需求。

但矛盾在于,如果一个人的自律和理性能帮助他围绕 RSS 建立一套健康的信息获取系统,那么有理由相信,即使强迫他换用基于算法的工具,他也不容易落入算法设置的陷阱。相反,如果一个人会轻易被算法操纵和左右,那么仅仅换用 RSS 也不足以弥补他在智识和判断力上的缺陷。「复兴 RSS」之所以不具有可行性,是因为在多数人需要一粒感冒药的时候,它递过去的却是一瓶蛋白粉。

实际上,《连线》此文所体现和唤起的对 RSS 的怀旧情结,早就不是第一次,也肯定不是最后一次。自从传统 RSS 阅读器的代表 Google Reader 在 2013 年关停以来,挽歌之声就不绝如缕。每遇到一次类似最近 Facebook 丑闻这样的技术公共事件,对 RSS 时代的怀念和倡导就会迎来一波高潮。

这不由让人联想到,几乎所有历史叙事中都存在那么一个人人怀念、却永远回不去的「黄金时代」。古代雅典的黄金时代是伯里克利改革后全民民主的时代。古代中国的黄金时代是尧舜禹治下大道之行的时代。而互联网发展史上的黄金时代,就是 RSS 作为信息聚合阅读主要工具的时代。在网络用户对那个时代的集体回忆里,网站是简单纯粹的,软件是安分守己的,聊天室里微风送客,讨论版上软语伴茶,好一派乌托邦般的理想景象。

但黄金时代的另一个名字是匮乏时代。货不必藏于己、力不必为己的另一面,是本来就没有多少财货可分,只有协力抱团才能生存。类似地,RSS 之所以在当年能普遍应用,是因为那时的网页大多数还是静态的,除了文本和简单的格式之外几乎就没有什么内容,很容易转化成 RSS 支持的统一格式。Web 1.0 时代也没有什么 UGC(用户生成内容)的概念,信息传递的路径还是网站到用户的单项输送,多数人靠浏览个别几个门户网站获取资讯,RSS 提供的一站式方案当然是很大的便利。这些前提在如今都被推翻了。你不能一边享受着 HTML5 和 JavaScript 带来的多彩体验,一边奢望它们能被发明于 20 世纪的 RSS 不失真地运载。你也不能一边抱怨着社交网络的垃圾信息,一边指望着只要「恢复时间线排序」就能药到病除。

《纽约时报》一篇采用 HTML5 技术的报道页面。RSS 难以容纳这样的新呈现形式。

在我看来,回音壁也好,信息过载也罢,固然是信息社会如今面临的严峻问题,算法也固然起了某种推波助澜的作用,但这都不是只靠怀旧就可以解决的。比起工具问题,它们的更本质的成因是思维问题、观念问题,其解决也只能从改变观念入手。

首先,人们应当意识到,摄入信息和摄入食物一样,并不是越多越好的。如上所述,人类思维并没有与技术同步进化,而还停留在那种面对信息饥不择食的状态。但信息已经提前物质一步迈向了后匮乏时代。继互联网让传播的边际成本归零之后,拜社交网络、内容农场和 AI 所赐,生产内容的边际成本也快被压缩到可以忽略不计。

如果说一篇网络写手为流量和推广而炮制的「标题党」稿件和一篇作家寤寐辗转写出的散文应当得到同样对待,谁都会觉得这是可笑的。可惜,人的本能并没有进化出如此基本的理性:当我们近乎无意识地不断刷新各种时间线的时候,不还是因为相信「下一条可能更有意义」吗?当我们为读不完各种公众号、付费内容而焦虑的时候,不还是出于「漏看一点就是损失」的恐惧吗?

然而,多刷一条不会带来更多意义,少看一篇也算不上任何损失。匮乏式思维的特点在于始终对错过的东西念念不忘,殊不知我们错过的东西是远远多于得到的东西的。举重明轻,如果我们都不遗憾于错过了那么多人、那么多风景,为什么反而要焦虑于没法读完每一条并无新意的新闻,纠结于无力刷遍每一条朝生暮死的热点?

其次,也是更重要的,要认识到无论是处于舆论风口浪尖的算法、还是重新被人想起的 RSS,它们作为筛选工具解决的都只是一个最初级的问题——如何获取信息。但在这之后,如何鉴别价值、去粗存精?如何纵横分析、延伸发散?如何理解吸收、化为己有?

RSS 不能告诉你这些,因为它的功能只是机械地反应信息的原貌。算法则不会告诉你这些,因为它的使命只是招揽流量的手臂。在知识和信息成为消费主义客体的时代,我们过于容易满足于「知乎」,而忘了质问「值乎」、探讨「止乎」、反思「智乎」。如果把关注点集中在后面几个更重要的问题上,工具之争其实根本没有想象的那么重要。

回到我们在文章最初提出的问题,答案是很清楚的。RSS 没法复兴,作为一种标记格式,它已经不适应新的内容量级和呈现技术。RSS 也没有必要复兴,作为一种信息聚合协议,它的本质和思路仍在被无数工具借鉴和继承。历史告诉我们,「复兴」的真正宾语从来不是什么具体的物件。正如启蒙运动是启蒙理性思维而不是文学流派,文艺复兴是复兴人文主义而不是希腊罗马,信息时代要启蒙和复兴的,不是原教旨的技术架构或者特定工具,而是人置身于海量信息而不被其裹挟,与算法、AI 的不确定性相处而不被其左右的能力。如不其然,复兴了 RSS,也只是给假新闻多一个传播的渠道;复兴了开放互联网,也只是给傲慢和偏见多一个活跃的温床。

关注少数派回复关键词,看更多精选文章 📱

iOS限免摄影WindowsApp壁纸音乐

ChromeAndroid小工具生活方式iPhone X游戏

登录查看更多
0

相关内容

RSS(简易信息聚合,也叫聚合内容)是一种描述和同步网站内容的格式。RSS可以是以下三个解释的其中一个: Really Simple Syndication;RDF (Resource Description Framework) Site Summary; Rich Site Summary。但其实这三个解释都是指同一种Syndication的技术。
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
【BAAI|2019】用深度学习模拟原子间势,王涵  (附pdf)
专知会员服务
17+阅读 · 2019年11月21日
可解释推荐:综述与新视角
专知会员服务
111+阅读 · 2019年10月13日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
7 个从来没推荐过的App,用了让你变得更厉害
高效率工具搜罗
9+阅读 · 2019年2月18日
可能是 Android 上最好用的写作 App
少数派
10+阅读 · 2018年12月21日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
百度的广告和今日头条的广告
keso怎么看
8+阅读 · 2018年2月9日
推荐|今日头条公布其算法原理(全)
全球人工智能
7+阅读 · 2018年1月16日
推荐系统杂谈
架构文摘
28+阅读 · 2017年9月15日
认识个性化推荐系统:从推荐算法到产品冷启动
人人都是产品经理
6+阅读 · 2017年9月15日
Arxiv
10+阅读 · 2019年2月19日
Arxiv
14+阅读 · 2018年4月18日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
5+阅读 · 2017年11月13日
VIP会员
相关资讯
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
7 个从来没推荐过的App,用了让你变得更厉害
高效率工具搜罗
9+阅读 · 2019年2月18日
可能是 Android 上最好用的写作 App
少数派
10+阅读 · 2018年12月21日
我是一个爬虫
码农翻身
12+阅读 · 2018年6月4日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
百度的广告和今日头条的广告
keso怎么看
8+阅读 · 2018年2月9日
推荐|今日头条公布其算法原理(全)
全球人工智能
7+阅读 · 2018年1月16日
推荐系统杂谈
架构文摘
28+阅读 · 2017年9月15日
认识个性化推荐系统:从推荐算法到产品冷启动
人人都是产品经理
6+阅读 · 2017年9月15日
Top
微信扫码咨询专知VIP会员