大量泄露的谷歌文件让我们前所未有地了解了谷歌搜索的内部情况,并揭示了谷歌用于对内容进行排名的一些最重要的元素。
发生了什么。3月 13 日,一个名为 yoshi-code-bot 的自动机器人在 Github 上 发布了数千份文档,这些文档似乎来自 Google 的内部内容 API 仓库 。本月早些时候,这些文档与 SparkToro 联合创始人 Rand Fishkin 分享。
我们为什么关心。 我们已经了解了 Google 排名算法的工作原理,这对于能够理解这一切意味着什么的 SEO 来说是无价的。2023 年,我们 通过一次 泄密史无前例地了解了 Yandex 搜索排名因素,这是当年最大的新闻之一。
这次 Google 文件泄露事件?这很可能成为 SEO 和 Google 搜索历史上最大的新闻之一。
里面有什么。 以下是我们对内部文件的了解,感谢 Fishkin 和 iPullRank 首席执行官 Michael King:
- 当前: 文档表明此信息截至三月是准确的。
- 排名特征: API 文档中包含 2,596 个模块,以及 14,014 个属性。
- 加权: 文档并未具体说明排名特征如何加权,只是说它们存在。
- Twiddlers: 根据 King 的说法,这些是重新排名功能,“可以调整文档的信息检索分数或更改文档的排名”。
- 降级: 内容可能因多种原因而被降级,例如:
- 链接与目标网站不匹配。
- SERP 信号表明用户不满意。
- 产品评论。
- 地点。
- 精确匹配域名。
- A片
- 更改历史记录: Google 会保留其曾经编入索引的每个页面的每个版本的副本。这意味着 Google 可以“记住”对页面所做的每项更改。但是,Google 在分析链接时仅使用 URL 的最后 20 次更改。
链接很重要。 我知道这很令人震惊。文档显示,链接多样性和相关性仍然是关键。而且 PageRank 在 Google 的排名功能中仍然非常活跃。网站主页的 PageRank 是每个文档的考量因素。
- 这并不能证明 Google 发言人撒谎,称链接不是“排名前 3 的因素”或链接对排名的影响较小。两种情况可以同时成立。同样,我们不知道这些特征的权重是多少。
成功的点击很重要。 这不应该令人震惊,但如果您想获得良好的排名,您必须根据文档不断创建出色的内容和用户体验。Google 使用各种测量方法,包括 badClicks、goodClicks、lastLongestClicks 和 unsquashedClicks。
“如果你想继续排名,你需要使用更广泛的查询来推动更多 成功 点击,并获得更多链接多样性,”King 说。“从概念上讲,这是有道理的,因为非常强大的内容可以做到这一点。专注于推动更多合格流量以获得更好的用户体验将向 Google 发出信号,表明你的网页值得排名。”
美国诉谷歌反垄断案的文件和证词证实 ,谷歌确实使用点击次数进行排名,尤其是其 Navboost 系统,“这是谷歌用于排名的“重要信号之一”。
品牌很重要。Fishkin 最大的收获是什么?品牌比什么都重要:“如果说我对那些希望大幅提高自然搜索排名和流量的营销人员有一条通用建议,那就是:‘在 Google 搜索之外,在你的领域打造一个知名、受欢迎、知名度高的品牌。’”
实体很重要。Google 会存储与内容相关的作者信息,并尝试确定某个实体是否是该文档的作者。
SiteAuthority: Google 使用一种叫做“siteAuthority”的东西。
- 谷歌告诉我们,在 2011 年熊猫更新发布后,就存在类似的事情,并公开表示“网站部分区域的低质量内容可能会影响网站整体的排名”。
- 然而, 此后几年,谷歌一直否认拥有网站权威评分。
Chrome 数据。 名为 ChromeInTotal 的模块表明 Google 使用其 Chrome 浏览器的数据进行搜索排名。
白名单。 一些模块表明 Google 将某些与选举和 COVID 相关的域列入白名单 – isElectionAuthority 和 isCovidLocalAuthority。尽管我们早就知道, 当“特定算法无意中影响网站”时,Google(和 Bing)会列出“例外列表” 。
文章。
- 算法的秘密: King 在 iPullRank 上泄露了 Google 搜索的内部工程文档
- 匿名人士与我分享了数千份泄露的 Google 搜索 API 文档;SEO 领域的每个人都应该看看, 作者:Fishkin,发布于 SparkToro
快速澄清一下。 关于这些文档是“泄露”还是“发现”存在一些争议。我听说这些内部文档很可能是在一次代码审查中被意外纳入的,并从 Google 内部代码库中推送到网上,然后才被发现。