回到主页

Google Search Console可靠性:试用版网站站长工具

几乎每个搜索引擎优化器都依赖于少数数据源。谷歌搜索控制台(以前称为谷歌网站管理员工具)可能已成为最普遍的。你可以用GSC做一些事情,比如拒绝链接,这是其他任何地方都无法完成的,所以我们在某些方面被迫依赖它。但是,像所有知识来源一样,我们必须对其进行测试以确定其可靠性 - 我们能否将我们的工艺归功于其建议?让我们看看我们是否可以撤回GSC数据,并一劳永逸地确定我们应该对其提供的数据持怀疑态度。

测试数据源

在我们深入研究之前,我认为值得快速讨论如何解决这个问题。为了这个分析,我想基本上引入两个概念:内部有效性和外部有效性。

内部有效性是指数据是否准确表示Google对您网站的了解。

外部有效性是指数据是否准确代表网络。

这两个概念对我们的讨论非常重要。根据我们作为SEO所解决的问题,我们可能更关心一个或另一个。例如,让我们假设页面速度是一个非常重要的排名因素,我们希望帮助客户。我们可能会关注GSC“下载页面时间”指标的内部有效性,因为无论真实用户发生什么,如果Google认为页面速度很慢,我们将失去排名。我们将依赖此指标,因为我们相信它代表了Google对客户网站的看法。另一方面,如果我们试图阻止谷歌找到不良链接,我们会担心外部有效性“链接到您的网站”部分,因为虽然Google可能已经知道一些不良链接,但我们希望确保没有任何其他Google可能会偶然发现。因此,根据GSC的示例链接如何全面描述网络上的链接,我们可能会拒绝该指标并使用其他来源(如Open Site Explorer,Majestic和Ahrefs)的组合,这将为我们提供更大的覆盖范围。

这个练习的目的只是说我们可以从多个角度来判断GSC的数据,重要的是取出这些数据,以便我们知道何时合理依赖GSC

GSC第1部分:HTML改进

在GSC的许多有用功能中,Google提供了在抓取您的网站过程中发现的一些常见HTML错误的列表。此部分位于“ 搜索外观”>“HTML改进”中,列出了几个可能的错误,包括“重复标题”,“重复说明”和其他可操作的建议。幸运的是,第一个例子让我们有机会概述测试内部外部有效性的方法的数据。正如您在下面的屏幕截图中看到的,GSC发现重复的元描述,因为网站具有不区分大小写的URL,没有规范标记或重定向来修复它。从本质上讲,您可以从/Page.aspx或/page.aspx访问该页面,这很明显,因为Googlebot已经找到了包含和不包含大小写的URL。让我们测试Google的建议,看它是否在外部和内部有效。

外部有效性:在这种情况下,外部有效性只是数据是否准确反映了互联网上出现的页面。可以想象,HTML改进列表可能会过时,具体取决于您网站的抓取速度。在这种情况下,该网站以前使用301重定向修复了该问题。

这真的不是特别令人惊讶。每当您对网站进行更正时,都不应期望Google更新此部分GSC。但是,它确实说明了GSC的一个常见问题。GSC提醒您的许多问题可能已由您或您的Web开发人员修复过。我不认为这是GSC的任何想象力的错误,只是一个限制,只能通过更频繁,有意识的爬行来解决,如Moz Pro的爬行审计或像Screaming Frog这样的独立工具。

内部有效性:这是事情开始变得有趣的地方。虽然Google不会频繁抓取您的网站以及实时捕获您网站的更新并不足为奇,但可以合理地预期Google抓取的内容会在GSC中准确反映出来。这似乎不是这种情况。

通过使用大写字母在Google中执行信息:http:// related-url查询,我们可以确定一些有关Google知道的URL的信息。Google会返回网址的小写版本的结果!这表明Google都知道纠正问题的301重定向,并在搜索索引中对其进行了更正。你可以想象,这给我们带来了很大的问题。GSC中的HTML改进建议不仅可能无法反映您对网站所做的更改,甚至可能无法反映Google已经知道的更正。鉴于这种差异,除了使用GSC之外,几乎总是有必要抓取您的网站以解决这些类型的问题

GSC第2节:索引状态

我们要解决的下一个指标是谷歌的索引状态,它可以为您提供Google从您的网站编入索引的准确页数。此部分位于Google Index> Index Status。此特定指标只能针对内部有效性进行测试,因为它专门向我们提供有关Google本身的信息。我们有几种方法可以解决这个问题......

  1. 我们可以将GSC中提供的数字与site:命令进行比较
  2. 我们可以将GSC中提供的数字与内部链接部分中主页的内部链接数量进行比较(假设网站上每个页面都有1个主页链接)

我们选择了两者。这个特定指标的最大问题是确定它正在测量什么。由于GSC允许您独立授权您网站的http,https,www和非www版本,因此对于“索引状态”度量标准中包含的内容可能会造成混淆。

我们发现,在仔细应用以确保没有不同类型的交叉(https vs http,www与非www)时,Index Status指标似乎与Google中的site:site.com查询非常相关,尤其是在较小的网站上。站点越大,我们在这些数字中看到的波动越大,但这可以通过site:命令执行的近似来解释。

但我们发现链接计数方法难以使用。考虑上面的图形。根据GSC索引的网站有1,587页,但该网站的主页有7,080个内部链接。这看起来非常不现实,因为我们无法找到单个页面,更不用说大多数页面,只有4个或更多链接返回主页。但是,考虑到与site:命令和GSC的索引状态的一致性,我认为内部链接的表示方式比使用“索引状态”度量标准更具问题。

我认为可以安全地得出结论,对于Google索引中实际包含的页数,“索引状态”指标可能是我们可用的最可靠指标。

GSC第3节:内部链接

搜索流量”>“内部链接”下的“内部链接”部分似乎很少使用,但可以非常有见地。如果外部链接告诉Google其他人认为您网站上的重要内容,那么内部链接会告诉Google 您认为在您的网站上重要的内容。此部分再次作为了解Google对您的网站的信息与您的网站实际情况之间的差异的有用示例。

测试此指标非常简单。我们获取了GSC提供的内部链接号,并将它们与完整站点爬网进行了比较。然后,我们可以确定Google的抓取是否足以代表实际网站。

一般来说,这两者与一些相当显着的偏差有适度的相关性。作为SEO,我发现这非常重要。Google不会在您的主页上启动并以与标准网站抓取工具相同的方式抓取您的网站(例如Moz Pro中包含的方式)。Googlebot通过外部链接,内部链接,站点地图,重定向等组合来接近您的网站,这可能会产生截然不同的画面。实际上,我们发现了几个示例,其中完整网站抓取了数百条Googlebot遗漏的内部链接。导航页面,如博客中的类别页面,被抓取的频率较低,因此某些页面在GSC中几乎没有像人们预期的那样仅仅在传统的爬行中累积。

作为搜索营销人员,在这种情况下,我们必须关注内部有效性,或谷歌对我们网站的看法。我强烈建议将Google的号码与您自己的网站抓取进行比较,以确定是否存在Google确定您在内部链接中忽略的重要内容。

GSC第4节:指向您网站的链接

链接数据始终是我们行业中最受欢迎的指标之一,这是正确的。外部链接仍然是排名的最强预测因素,谷歌已经一次又一次地承认。那么GSC的链接数据如何衡量呢?

在此分析中,我们将GSC提供给我们的链接与Ahrefs,Majestic和Moz提供的链接进行了比较,了解这些链接是否仍然有效。为了公平对待仅提供链接样本的GSC,我们仅使用总反馈少于1,000的网站,增加了我们从GSC获得全面(或至少接近它)的可能性。结果令人吃惊。GSC的列表,包括“示例链接”和“最新链接”,在我们测试的每个网站的“实时链接”方面表现最差,从未击败过Moz,Majestic或Ahrefs。

我确实希望清楚地了解Moz在这个特定测试中的表现。由于Moz的总指数较小,因此我们很可能只会表现出更高质量,更持久的链接。我们表现​​优异的Majestic和Ahrefs只有几个百分点可能是指数大小的副作用,而不是反映出实质性差异。但是,将GSC与所有3个链接索引分开的几个百分点不容忽视。就外部有效性而言 -也就是说,这些数据反映了网络上实际发生的情况 - GSC超越了第三方索引。

内部有效性呢?GSC是否让我们重新审视了Google的实际反向链接索引?看起来这两者是一致的,因为很少报告谷歌已经知道的链接不再在索引中。我们根据我们的测试随机选择了数百个“不再找到”的网址,以确定Googlebot是否仍然使用旧版本进行缓存,并且统一地说就是这种情况。虽然我们无法确定它是否显示了与您的网站相关的一整套Google链接索引,但我们可以确信Google倾向于仅显示与其最新数据一致的结果。

GSC第5节:搜索分析

搜索分析可能是Google Search Console中最重要且利用率最高的功能,因为它可以让我们深入了解谷歌Google Analytics的“未提供”更新所导致的数据丢失情况。许多人正确地质疑数据的准确性,因此我们决定仔细研究一下。

实验分析

搜索分析部分为我们提供了一个利用实验设计来确定数据可靠性的独特机会。与我们测试的其他一些指标不同,我们可以通过在某些情况下向网站上的各个网页提供点击来控制现实。我们开发了一项研究如下:

  1. 创建一系列荒谬的文本页面。
  2. 从内部来源链接到他们以鼓励索引。
  3. 使用志愿者对无意义的术语进行搜索,这不可避免地揭示了我们创建的完全匹配的荒谬内容。
  4. 改变这些志愿者搜索的情况,以确定GSC是否仅在某些环境中跟踪点击次数和展示次数。
  5. 使用志愿者点击这些结果。
  6. 记录他们的行动。
  7. 与GSC提供的数据相比。

我们决定检查5种不同的环境以确保其可靠性:

  1. 用户执行在Chrome中登录Google的搜索
  2. 用户执行已注销的搜索,在Chrome中隐身
  3. 用户从移动设备执行搜索
  4. 用户执行在Firefox中注销的搜索
  5. 用户在一天中执行相同的搜索5次

我们希望这些变体可以回答有关Google用于收集GSC数据的方法的具体问题。我们非常和失望。

实验结果

GSC仅记录了84次中的2次展示,绝对是0次点击。鉴于这些结果,我立即关注实验设计。也许谷歌没有为这些页面记录数据?也许我们没有达到记录数据所需的最小数量,只是在上一次每人5次搜索的研究中几乎没有黯然失色?

不幸的是,这些解释都没有多大意义。实际上,几个测试页面为数百个奇怪的,低级别的关键字提供了印象,这些关键字恰好在无意义的测试中随机发生。此外,网站上的许多网页都显示了非常低的展示次数和点击次数,与Google Analytics数据相比,确实只有很少的点击次数。很明显,无论用户情况如何,GSC都不能依赖于轻度搜索的术语。通过此帐户,这不是外部有效的 -也就是说,GSC中的展示次数和点击次数无法可靠地反映在Google上执行的展示次数和点击次数。

你可以想象,我对这个结果并不满意。也许实验设计有一些不可预见的限制,标准比较分析会发现这些限制。

对比分析

我采取的下一步是将GSC数据与其他来源进行比较,看看我们是否能够找到所呈现数据与次要测量之间的某种关系,这可能会说明为什么最初的GSC实验反映出数据质量如此糟糕。最直接的比较是GSC与Google Analytics的比较。从理论上讲,GSC对点击的报告应该反映谷歌分析记录谷歌的有机点击,如果不是相同,至少按比例。由于担心与实验项目的规模有关,我决定先尝试一组较大的网站。

不幸的是,结果却截然不同。根据GA,第一个示例网站每天从Google Organic Search获得大约6,000次点击。据GA称,根据GS,每月有数百个有机点击次数达到数百页的点击次数达到了0次。但是,在这种情况下,我能够发现一个罪魁祸首,它与跟踪点击的方式有关。

GSC根据搜索结果中的URL跟踪点击(假设您单击/pageA.html)。但是,我们假设/pageA.html重定向到/pagea.html,因为您很聪明,并决定修复页面顶部讨论的套管问题。如果Googlebot尚未选择该修补程序,则Google搜索仍会保留旧网址,但点击将在更正的网址上记录在Google Analytics中,因为这是GA代码触发的页面。最近在第一个网站上进行了足够的清理工作,我测试了GA和GSC的相关系数仅为0.52!

所以,我去寻找可能提供更清晰画面的其他属性。在分析了几个没有类似问题的属性之后,我们确定了有机着陆页上GSC和Google Analytics报告之间的大约.94到.99的相关性。这看起来非常强大。

最后,我们还进行了一种比较分析,以确定GSC排名数据的可信度。一般来说,网站收到的点击次数应该是收到的展示次数和SERP中的什么位置的函数。虽然这显然是对所有因素的不完整看法,但如果我们知道展示次数和点击次数,我们可以比较两个排名集的质量,这似乎是公平的。从理论上讲,排名跟踪方法可以更好地预测给定印象的点击次数。

叫我不要惊讶,但这甚至都不是很接近。标准排名跟踪方法在预测实际点击次数方面的效果要好于Google Search Console中显示的排名。我们知道GSC的排名数据是一个平均位置,几乎可以肯定会出现错误的情况。有很多情况都是如此,但我要解释一下。想象一下,您添加了新内容,关键字从位置80开始,然后移至70,然后移至60,最终移至#1。现在,假设您创建了一个不同的内容,它位于第40位,从不动摇。GSC将报告两者的平均位置为40。但是,第一个位置在第1位时将获得相当大的流量,而后者将永远不会收到任何流量。GSC” 基于印象数据的平均方法过多地模糊了基础特征以提供相关预测。在Google收集GSC排名数据的方法中明确更改之前,仅仅了解您网站当前位置的真相是不够的。

和解

那么,我们如何将实验结果与GSC Search Analytics的正面和负面的比较结果进行协调?好吧,我认为有一些明确的要点。

  1. 印象数据充其量是误导性的,而在最坏的情况下则是假的:我们可以确定所有印象都没有被捕获,并且没有准确地反映在GSC数据中。
  2. 点击数据按比例准确:点击可以作为比例指标(即:与现实相关)而不是特定数据点。
  3. 点击数据有助于告诉您哪些网址排名,但不知道他们实际登陆的网页。

理解这种和解可能非常有价值。例如,如果您发现GSC中的点击数据与您的Google Analytics数据不成比例,则您的网站很可能会以Googlebot尚未发现或应用的方式使用重定向。这可能表明需要解决的根本问题。

最后的想法

Google Search Console提供了大量宝贵的数据,智能网站管理员依赖这些数据来制定数据驱动的营销决策。但是,我们应该像任何数据源一样对这些数据持怀疑态度,并继续测试它的内部和外部有效性。我们还应该特别注意我们使用数据的适当方式,以便在数据不足的情况下得出不安全或不可靠的结论。也许最重要的是:验证,验证,验证。如果您有办法,请使用不同的工具和服务来验证您在Google Search Console中找到的数据,确保您和您的团队使用可靠的数据。

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的