2000 年的时候,Google 得以流行,是因为黑客们发现它比 Lycos 或 Excite 更好用。这种效应正在再次发生。早期的使用者们正在弃用 Google。
(Google 的)搜索结果在不断地「优化」,以适应 80% 流行的索搜索;而任何技术性的或者晦涩的搜索,结果则变得更加糟糕。强制同义词和「人们也在搜索」通常没有效果,并且其结果几乎令人火大。一旦你离开了第一页或者第二页,结果就会变得更糟——开始出现与搜索词完全无关的网页(甚至都不包含搜索的短语)。他们可能正在测试新功能,或者已经实现了某些优化,就像 Youtube 的搜索结果一样:只显示流行的视频(而忽略了相关性),并期待它们能够带来点击。
最近,一个小小的医疗问题凸显了人们对 Google 搜索之外的搜索引擎的强烈需求。在相当多的重要类别中,Google 已经不再返回高质量的搜索结果了。
我今天在健康、产品评论、食谱三个类别下进行了搜索,最靠前的结果都是充斥着垃圾广告的、诱导点击的网站。我敢打赌,还有更多这样的搜索结果。
这可能不仅仅是 Google 的问题,也是击败 Google 的秘诀。一个初创公司通常要从一个细分市场开始。那么,为什么不尝试专门为某个被 SEO 垃圾信息支配的类别开发一个搜索引擎呢?
「目前,商用搜索引擎的主要商业模式就是广告。广告与向用户提供高质量的搜索的目标上并不完全一致……我们预计,由广告资助的搜索引擎将在本质上偏向于广告主而不是用户……此外,广告收入提供了这样一种激励:去提供低质量的搜索结果。」
TLDR:互联网上很大一部分被认为是人类生产的内容,实际上是由 AI 与付费的秘密媒体合作生产的。其目的是为越来越多的新常态文化产品培养消费者。
我在 Google 搜索部门工作,这是对您反馈问题的回复,谢谢。您在帖子中说,搜索词加引号没有返回精确匹配的结果。老实说,是有的。给一个词语或者短语加上引号,引号内的就是我们会精确匹配的内容。如果谁有一个没有触发精确匹配的例子,请告诉我... 下面是人们认为 Google 的引号不起作用,而它确实起作用了的原因(我已经看过了太多此类报告):
我们进行全文匹配
我们会匹配容易被忽视的文本,比如菜单栏或者小号字体的文本
我们为网页建立索引之后,它的内容又发生了改变
标点符号的问题……
标点符号会有影响。当输入带引号的搜索词,例如「"dog cat"」,对于网页中的「"dog cat"」这样的文本,我们会将其看作不带标点符号的形式。这看起来不是一个很大的问题,但是,我们也正在研究能否在这方面有所改进。
在「quotes don't give」的例子中,我得到的第一个结果是 <https://www.goodreads.com/quotes/tag/never-give-up>。 当我在网页内搜索「quotes don't give」,精确匹配的结果是零条。这,我感觉受到了欺骗。 ……但是,如果看得更仔细一些,会发现在网页底部,有这样一段「tags: don-t-give-up, don-t-give-up-on-your-dreams, don-t-give-up-on-yourself, don-t-give-up-quotes, don-t-give-up-the-fight, encouragement, ...」 由于词例化的问题,「don-t-give-up-quotes, don-t-give-up-the-fight」会得到「don t give up quotes don t give up the fight」,它确实包含了「quotes don t give」,而这也是「quotes don't give」的词例化结果。
正如下面的另一个回复指出的,在第一个结果中,如果你看一下我们已经建好索引的缓存页面(而不是你登陆的网页版本),有这样的一段: quotes, don-t-give-up-the-fight 去掉其中的标点符号,就匹配上了 quotes dont give。 我知道这可能令人沮丧:我们在带引号的搜索中没有考虑标点符号的问题。但是,这并不是才有的,而是一直如此。正如我所说,我们可能会重新审视这个问题。
「关于我死亡的报道被大大地夸大了。」——Google,也许吧
我想我知道这篇文章想要传达的了。它不是说 Google 的搜索技术(比 Reddit)更差,也不是说人们不使用 Google 搜索了。它说的是,与 Reddit 上的讨论相比,人们对于 Google 的搜索结果更加不信任。 比如说,当我想看对于本田思域 2022 年的新车或其它汽车的评论,我发现我就是会搜索「Honda Civic review reddit」而不是「Honda Civic review」。因为我想看看真人、(在 r/cars 频道或其它地方的)爱好者们是如何谈论这款车的,而不是Google的头部结果,那些基本上都是为这款车打广告的付费评论。 我知道 Reddit 上的人也可能会说一些完全错误的废话,但是,我觉得这些讨论比Google展示的那些「大型网站」上的文章中的官方言论更加真实。