在搜索引擎找到你想要的答案,为什么越来越难了?

2022 年 3 月 18 日 少数派
作者按: 本文已获得原作者授权翻译与转载。如需转载,请知会少数派编辑部并注明原文与本文地址。原文链接:https://dkb.io/post/google-search-is-dying
Reddit 是目前最受欢迎的搜索引擎。唯一不知道这一点的只有 Reddit 自己,他们不屑于建立一个像样的搜索界面。因此,人们只能使用 Google,然后在搜索词的最后加上 「reddit」。
Paul Graham 认为下面这张图片表明 Reddit 作为一个社交媒体网站「还没有到顶」。它意味着使用 Reddit 作为搜索引擎的人数一直在增长。
保罗格雷厄姆认为 Reddit 作为社交媒体网站还没有到顶
为什么人们要专门在 Reddit 上进行搜索呢?短的答案是,Google 搜索的结果正变得越来越差。长的答案是,大部分的网站已经失去了真实性,失去了可信度。
我们怎么知道 Google 正在消亡?
如果你最近尝试搜索过食谱或产品评论,我不需要告诉你,Google 的搜索结果已经变成了狗屎。你肯定已经注意到了,前几个非广告的结果是 SEO 优化后的网站,其中充斥着附属链接和广告。
而在许多其它类别中,Google 仍然能够返回像样的结果,特别是一些事实性的信息。因此,你可能觉得 Google 的搜索结果还挺好,不明白我在说什么。
你可能没有意识到的是,你一直在自我审查——不去搜索大多数你本来可能想要搜索的。这是因为,你的潜意识已经知道了,Google 不会返回一个好的结果。
我并不是唯一一个认为 Google 正在消亡的人:
Daniel Gross  如是说:
2000 年的时候,Google 得以流行,是因为黑客们发现它比 Lycos 或 Excite 更好用。这种效应正在再次发生。早期的使用者们正在弃用 Google。
在 Hacker News 的「 Google 搜索变差了吗? 」问题下,一个网友回复说:
(Google 的)搜索结果在不断地「优化」,以适应 80% 流行的索搜索;而任何技术性的或者晦涩的搜索,结果则变得更加糟糕。强制同义词和「人们也在搜索」通常没有效果,并且其结果几乎令人火大。一旦你离开了第一页或者第二页,结果就会变得更糟——开始出现与搜索词完全无关的网页(甚至都不包含搜索的短语)。他们可能正在测试新功能,或者已经实现了某些优化,就像 Youtube 的搜索结果一样:只显示流行的视频(而忽略了相关性),并期待它们能够带来点击。
Michael Seibel  说:
最近,一个小小的医疗问题凸显了人们对 Google 搜索之外的搜索引擎的强烈需求。在相当多的重要类别中,Google 已经不再返回高质量的搜索结果了。
我今天在健康、产品评论、食谱三个类别下进行了搜索,最靠前的结果都是充斥着垃圾广告的、诱导点击的网站。我敢打赌,还有更多这样的搜索结果。
Paul Graham  是这样说的:
这可能不仅仅是 Google 的问题,也是击败 Google 的秘诀。一个初创公司通常要从一个细分市场开始。那么,为什么不尝试专门为某个被 SEO 垃圾信息支配的类别开发一个搜索引擎呢?
为什么 Google 正在消亡?

广告

显然,广告给搜索引擎带来了错误的激励。Google 的创始人在他们刚刚起步的时候已经指明了这一点。
在  Sergey Brin and Lawrence Page (1998)  一文中,他们写道:
「目前,商用搜索引擎的主要商业模式就是广告。广告与向用户提供高质量的搜索的目标上并不完全一致……我们预计,由广告资助的搜索引擎将在本质上偏向于广告主而不是用户……此外,广告收入提供了这样一种激励:去提供低质量的搜索结果。」
不幸的是,这些关于「基于广告的搜索引擎将如何失败」的思考,读起来就像指导 Google 下一步行动的指南。
在 Google 搜索不可避免的崩溃之前,他们把广告的限度放到最大,想要榨干最后一分钱。
Google 搜索充斥着广告

搜索引擎优化

很多人的工作就是通过各种方式让网站的搜索排名更加靠前。所以,搜索结果质量的下降,一点都不稀奇。公平地说,这可能是任何搜索引擎都会遇到的问题,但是,人们会期望 Google 能够设计出更加公平的算法,解决掉这个问题。
这里有一个关于「如何让一个网站登顶 Google 挪威的搜索之巅」的 故事

人工智能

Google 正在脱离用户输入来返回搜索结果。它试图变得更加「聪明」:识别用户的「真实意图」,并提供个性化的结果。如果搜索框里已经是用户的真实意图了,那么所有的搜索结果可能都将变得不相关。
即使是精确匹配的查询运算符(""), 也不再提供精确匹配的结果了 。这简直离谱!
为什么人们要在他们的搜索词后追加 「reddit」?
最近出现了一个有趣的阴谋论: 互联网已死论  。其基本主张是,互联网上大部分都是机器人了,这里已经没有真实的人了。
IlluminatiPirate  如是说:
TLDR:互联网上很大一部分被认为是人类生产的内容,实际上是由 AI 与付费的秘密媒体合作生产的。其目的是为越来越多的新常态文化产品培养消费者。
这不是真的(至少目前不是),但它反映了某种普遍的认识——真实的互联网已经消失了。那些试图提高网站在 Google 搜索结果中排名的 SEO 人员可能都是机器人。一切都被商业化了。无论是机器人还是人类,它们(他们)总是想向你推销。这,虚假至极。
那么,我们如何才能重获真实?比如,去了解一个真正的、活生生的人对最新的联想笔记本电脑的看法?
在搜索词后追加「reddit」吧(或者「hacker news」,或者「stackoverflow」,或者其它你所信任的社区)。
Google 已死。
Google+site:reddit.com 将长存。
附录 1:Google 的回应

Google 声称「精确匹配」的搜索只是不直观,这一项功能并未被移除

Danny Sullivan( Google 公共搜索联络人)说:
我在 Google 搜索部门工作,这是对您反馈问题的回复,谢谢。您在帖子中说,搜索词加引号没有返回精确匹配的结果。老实说,是有的。给一个词语或者短语加上引号,引号内的就是我们会精确匹配的内容。如果谁有一个没有触发精确匹配的例子,请告诉我...
下面是人们认为 Google 的引号不起作用,而它确实起作用了的原因(我已经看过了太多此类报告):
  1. 我们进行全文匹配

  2. 我们会匹配容易被忽视的文本,比如菜单栏或者小号字体的文本

  3. 我们为网页建立索引之后,它的内容又发生了改变

  4. 标点符号的问题……

标点符号会有影响。当输入带引号的搜索词,例如「"dog cat"」,对于网页中的「"dog cat"」这样的文本,我们会将其看作不带标点符号的形式。这看起来不是一个很大的问题,但是,我们也正在研究能否在这方面有所改进。

到目前为止,Google 似乎是对的

到目前为止,每一个不生效的精确匹配的例子都可以追溯到标点符号、全文匹配的问题,等等。
举个例子,有这样一个 查询失败的例子 「quotes don't give」。Hacker News 的用户  saalweachter  指出,这是一个非常复杂的标点符号问题:
在「quotes don't give」的例子中,我得到的第一个结果是 <https://www.goodreads.com/quotes/tag/never-give-up>。
当我在网页内搜索「quotes don't give」,精确匹配的结果是零条。这,我感觉受到了欺骗。
……但是,如果看得更仔细一些,会发现在网页底部,有这样一段「tags: don-t-give-up, don-t-give-up-on-your-dreams, don-t-give-up-on-yourself, don-t-give-up-quotes, don-t-give-up-the-fight, encouragement, ...」
由于词例化的问题,「don-t-give-up-quotes, don-t-give-up-the-fight」会得到「don t give up quotes don t give up the fight」,它确实包含了「quotes don t give」,而这也是「quotes don't give」的词例化结果。
而 Danny Sullivan 是这样回复的:
正如下面的另一个回复指出的,在第一个结果中,如果你看一下我们已经建好索引的缓存页面(而不是你登陆的网页版本),有这样的一段:
quotes, don-t-give-up-the-fight
去掉其中的标点符号,就匹配上了 quotes dont give。
我知道这可能令人沮丧:我们在带引号的搜索中没有考虑标点符号的问题。但是,这并不是才有的,而是一直如此。正如我所说,我们可能会重新审视这个问题。
附录 2:你错了,Google 并未消亡,它的营收再创新高,这就是最好的证明
我从未说过 Google 不赚钱。事实上,如果 Google 真的不顾搜索质量,一心想从搜索广告中榨取每一分钱,他们的营收预计会达到历史最高水平。
我说的是,搜索结果的质量正在下降。最终,这可能会导致营收的下降,只是目前还没有而已。
附录 3:说真的,这篇文章不知所云。我的搜索结果很完美
如果你认为自己的搜索结果很完美(在没有追加「reddit」的情况下),你可能是对的;如果每个人都认为 Google 的搜索结果很垃圾,它早就倒闭了。
更可能的情况是,80% 的人认为 Google 足够好了,20% 的人认为 Google 是垃圾。
我怀疑这 20% 的人数会越来越多。
附录 4:这是过去的 20 年里第 87 次有人声称 Google 搜索正在消亡。在 SEO 界,这是一个永恒的话题
「关于我死亡的报道被大大地夸大了。」——Google,也许吧
是的,在过去的 20 年中,每隔几个月就会有一篇抨击 Google 的文章。这篇文章可能什么都不算。
不过,有点意思的是,这篇短文现在是 Hacker News 上创站以来点赞最多的文章之一。一定有许多人对此产生了共鸣吧。
因此,很难说它是否会带来重大的变革。
附录 5:Reddit 用户对本文观点的回复
u/a_latvian_potato  说:
我想我知道这篇文章想要传达的了。它不是说 Google 的搜索技术(比 Reddit)更差,也不是说人们不使用 Google 搜索了。它说的是,与 Reddit 上的讨论相比,人们对于 Google 的搜索结果更加不信任。
比如说,当我想看对于本田思域 2022 年的新车或其它汽车的评论,我发现我就是会搜索「Honda Civic review reddit」而不是「Honda Civic review」。因为我想看看真人、(在 r/cars 频道或其它地方的)爱好者们是如何谈论这款车的,而不是Google的头部结果,那些基本上都是为这款车打广告的付费评论。
我知道 Reddit 上的人也可能会说一些完全错误的废话,但是,我觉得这些讨论比Google展示的那些「大型网站」上的文章中的官方言论更加真实。
附录 6: 由  @zenacomics  创作的一张有趣的漫画
zenacomics 创作的关于Google的漫画

附录 7:关于在互联网上组织信息的更多想法

如果你想更加深入地了解这个课题,可以看看  https://dkb.io/post/organize-the-world-information  这篇文章  ,其中探讨了在互联网上有用地组织信息的不同方式。
原文链接:
https://sspai.com/post/72065?utm_source=wechat&utm_medium=social
作者:赵喧典
责编:张奕源Nick
题图来自 Unsplash:@firmbee
/ 更多热门文章 /
登录查看更多
0

相关内容

互联网
专知会员服务
117+阅读 · 2021年10月17日
专知会员服务
43+阅读 · 2021年7月6日
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
93+阅读 · 2021年7月2日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
61+阅读 · 2021年2月16日
【DeepMind】强化学习教程,83页ppt
专知会员服务
153+阅读 · 2020年8月7日
【ICML2020-Tutorial】无标签表示学习,222页ppt,DeepMind
专知会员服务
89+阅读 · 2020年7月14日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
107+阅读 · 2019年6月21日
Google搜索老矣,尚能饭否?
CSDN
0+阅读 · 2022年4月14日
为什么营销效果越来越差?
人人都是产品经理
0+阅读 · 2022年4月4日
内容运营:你必须回答的 3 个问题
人人都是产品经理
0+阅读 · 2022年3月6日
Google搜索正在“死亡”
CSDN
0+阅读 · 2022年2月22日
年轻人的胃为什么越来越不行了?
36氪
0+阅读 · 2022年2月12日
关于 Android 13,目前我们所知道的一切
InfoQ
0+阅读 · 2022年1月21日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
23+阅读 · 2018年10月1日
VIP会员
相关VIP内容
专知会员服务
117+阅读 · 2021年10月17日
专知会员服务
43+阅读 · 2021年7月6日
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
93+阅读 · 2021年7月2日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
61+阅读 · 2021年2月16日
【DeepMind】强化学习教程,83页ppt
专知会员服务
153+阅读 · 2020年8月7日
【ICML2020-Tutorial】无标签表示学习,222页ppt,DeepMind
专知会员服务
89+阅读 · 2020年7月14日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
107+阅读 · 2019年6月21日
相关资讯
Google搜索老矣,尚能饭否?
CSDN
0+阅读 · 2022年4月14日
为什么营销效果越来越差?
人人都是产品经理
0+阅读 · 2022年4月4日
内容运营:你必须回答的 3 个问题
人人都是产品经理
0+阅读 · 2022年3月6日
Google搜索正在“死亡”
CSDN
0+阅读 · 2022年2月22日
年轻人的胃为什么越来越不行了?
36氪
0+阅读 · 2022年2月12日
关于 Android 13,目前我们所知道的一切
InfoQ
0+阅读 · 2022年1月21日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员