Return to site

8 点的清单的奇怪问题 SEO 调试技术

· seo优化

偶尔 , 一个问题会在你的桌子有点普通。一些地方就不容易找到答案。你去到你的大脑和大脑不返回任何内容。

这些问题不能解决的一些基本的关键字研究和技术配置。这些不同类型的 SEO 技术问题的深入兔子洞。

在这些情况下很自然的无视了清单 , 但它最好有一个 , 就如同它们具有对平面 : 即便是最能干的人也会忘记事情 , 并且你将检查表 provvide 需要挖掘的地方。

喜欢奇怪的 SEO 问题 ?这里的四个例子来琢磨你读。我们将回答这些问题。

1.为什么不是 5 星标记表示谷歌产品页面 ?

  • - 服务器渲染的页面上的产品标记 , 且标记 feefo 产品包括等级客户机侧连接。
  • 该评级 feefo 成功获取渲染片断的渲染 & , 加上便捷的移动工具。
  • 当您将 DOM 渲染到结构化数据测试工具中 , 两个片的无结构化数据出现错误。

2.为什么不显示 Bing 5 星点评页面的标记 , 当将谷歌吗 ?

  • 在点评页面的客户端 , 每个参赛选手都有评级 & rich snippets google 。
  • 所有参赛者在 Bing 评级丰富的片段 ;然而 , 客户端未。
  • 在审查页面上正确验证评级模式对 Google 的结构化数据测试工具 , 但没有对 Bing 。

3.为什么没有获得索引页的标签索引吗 ?

  • 页面与服务器端索引时不必在标签的头部是由谷歌索引的模板的一个大客户。

4.为什么网站上任何一页返回 302 约 20 – 50% , 但是仅用于爬虫 ?

  • 一个网站被随机扔 302 错误。
  • 这事从未发生 , 只有在浏览器中的搜寻器。
  • 用户代理没有差异 ;位置或饼干 , 也改变不了什么。

最后 , 简单说几句。有一些此检查表不能适用于每个场景。那完全没关系。这是你的一切检查 , 一切都不是你应该检查。

完整的清单
前检查清单   究竟有多大 ?

这类问题仅影响少量的交通吗 ?它是仅在少数几页中 , 您已经有一个很大的动作列表 , 将其他网站的帮助吗 ?你可能需要去放弃它。

我知道 , 我也讨厌它。我也希望是对挖掘和研究这些东西。但是 , 当你解决复杂兔子洞二十 SEO 和网站已经持平 , 因为你没再写标题标签 , 你还会被开除。

但希望情况不是这样的 , 在这种情况下 , 向前迈进 !

  你看这个问题 ?

我们不想浪费大量时间。你听过这说法吗 ?:“如果你听到蹄子 , 那它可能不是斑马。”

该过程中 , 我们要走的是相当复杂和完全由你决定如果你想继续。只要确保你也没有明显的特征 , 能够解决你的问题。这里有一些常见的问题 , 我主要是马。

  1. 你从哪里是你表现不佳。
    1. 当现场表现奇差 , 人们总是爱找借口。谷歌可能是相当怪异的废话伸手指责。在现实中 , 通常是一些组合立地条件差、高竞争 , 没有品牌。马。
  2. 你难道交通突然下降。
    1. 当然事情已经发生 , 但这不可能是你的检查表。有很多常识性的清单。我写过诊断业务下降最近检查出来。
  3. 错误页面是排序的查询。
    1. 在我的经验 ( 可能这序言全文) , 这通常是一个基本问题 , 具有差的或靶向的位点的蚕食。也许马。

因素反而会让你有更多的复杂问题 , 需要您不要调试你的鞋子 :

  • 一个网站有大量的客户端 JavaScript 。
  • 更大、更古老的传统网站。
  • 你的问题涉及的新的 google 特性或特征的存在较少知识社区。
1.一些实施例的开始页面。

选几个范例 — — 页面与呈现的问题 , 不管你的感受。不 , 这不是代表 , 但我们会回到这里。

当然 , 如果它只影响的很小数目的页 , 然后它可能实际上是代表性的 , 在这种情况下 , 我们都很好。这绝对重要 , 对吗 ?你不只是跳过上述的步骤 ?OK , 凉爽 , 让我们继续。

2.谷歌抓取的网页可以吗 ?

首先 , 我们检查是否有爬虫访问该页面 , 我们将其定义为一个状态码 200 。

我们看看四种方式暴露在任何常见的问题 :

  1. robots. txt :打开搜索并查看 robots. txt 中的验证器。
  2. 用户代理 :打开工具开发并验证您可以打开 URL 和 Googlebot Googlebot 的移动。
    1. 得到的 User Agent Switcher , 打开工具开发。
    2. 检查控制台抽屉打开时 , 肘节 ( 退出键 )
    3. 打 … 的开放和 “网络条件”
    4. 这里 , 用户选择你的代理 !
  1. IP 地址:验证您可以访问的页面移动工具测试。( 这是从 Google 将 IPS ;你做任何检查 , 不会从您的计算机。 )
  2. 国家 :移动测试工具从 IPS 将访问美国 , 据我的经验 , 所以我们有两个人。但偶尔会从 Googlebot 爬行美国非 IPS , VPN 的使用也值得仔细检查你的网站是否可以访问的任何其他有关国家。
    1. 我使用hidemyass对于这些 , 但是不管你有 VPN 可以很好地工作。

我们现在应该知道或未记住正在努力获取的网页。

我们发现有任何问题吗 ?

如果我们可以重新创建的失败有一个简单的检查 , 那么它很可能是谷歌机器人可能不能始终如一地获取页面中的通常的基本原因。

不过 , 也可能不是。许多问题是由于不一致的技术。;)

3.谷歌告诉我们是两个不同的东西吗 ?

接下来就是谷歌能够找到的 , 可是我们通过讲述它混淆两种不同的东西吗 ?

这是最常见的 , 在我的经验 , 因为有人把索引的指令。

通过 “索引指示 ,“ 我指的是任何标记 , 其定义了正确索引或索引页的状态的等级。这里的非穷尽列表 :

  • 非索引
  • 规范
  • 交替移动标签
  • 放大器交替标签

混合的实施例提供的消息 :

  • - 没有页面的索引
  • 一个页到 B 页 canonicals

或 :

  • 有一个规范的页面中的报头的参数
  • 一个页面有一个规范的主体不具有参数

如果我们提供的信息 , 则还不清楚谷歌将如何应对。这是一个伟大的方式开始看到一些奇怪的结果。

好地方来检查索引指示上面列出 :

  • 网站地图
    • 示例 : 移动替换标签可以在一个网站地图
  • HTTP 头
    • 示例 : 元和规范可被设置在机器人头。
  • HTML 头
    • 这是你的话 , 你会需要这个的一个比较。
  • JavaScript 渲染与硬编码指令
    • 你可以设定一个页面 , 然后呈现另一个 JavaScript 。你就会看到不同的 HTML 源从 DOM 呈现。
  • Google 搜索设置控制台
    • 控制台设置有用于搜索和定位 , 忽略国家参数可以与索引页的标签上。
在简短的 DOM 渲染

这个网页是一个经常被人提及的 DOM 渲染 (18 , 如果你好奇的话) 。因为我们是第一次 , 这是一个快速回顾什么的。

当您加载一个网页 , 该第一请求是 HTML 。这是你所看到的 HTML 源文件 ( 右键查看源文件的网页和点击) 。

这个是之前有过什么 JavaScript 的页面。这没有什么特别之处 , 但现在这么多的网站依赖于 JavaScript 的相当合理 , 大多数人都不会相信的初始 HTML 。

渲染的 DOM 的页的技术术语 , 当所有的 JavaScript 渲染和所有页面的更改。你可以看到在这个工具开发。

你可以在 Chrome 右键单击, 然后检查元件 (或 Ctrl + Shift + I) 。该选项卡将显示该 DOM 元素的呈现。当停止闪烁、改变它 , 然后你会得到整个 DOM 渲染 !

4.谷歌抓取的页面可以持续吗 ?

谷歌是看到什么 , 我们需要获取日志文件。在这一点上 , 我们可以看到它是如何被访问的页面。

旁白 :工作日志是与整个柱本身。我写了一本指南日志分析与 BigQuery, 我还的确建议尝试青蛙惨叫日志分析器做了很多很好的处理的复杂性。

当我们看爬行有三个有效牵制我们可以做到 :

  1. 状态代码 :在状态代码。谷歌是看到不同状态码不是你当你检查 URL ?
  2. 资源 :所有的资源下载是谷歌的页面 ?
    1. 它是所有你的网站下载特定的 JavaScript 和 CSS 文件 , 它需要生成页面 ?
  3. 页面尺寸 :在 MAX 和 MIN 的所有页面和资源各不相同。如果你看到差别 , 那么谷歌可能未完全下载的所有资源或页面。
我们发现有任何问题吗 ?

如果谷歌没有在 200s 的日志文件 , 但我们可以访问该页面时没问题 , 那么显然还有一些区别和记住自己。这些差异可能是什么 ?

  1. 它将超过美国
  2. 显然它是一个机器人 , 而不是一个人假装是个机器人
  3. 它将在一天的不同时间

这意味着 :

  • 如果我们的网站是做 BOT 聪明阻塞 , 它可能能够区分我们和 Googlebot 。
  • 因为谷歌机器人将更强调我们的 Web 服务器 , 它可能表现得不同。当网站有大量的机器人 , 或游客来访 , 他们可能采取某些动作以帮助保持在线网站。他们可能会转而向更多的计算机功率的网站 (这被称为缩放) , 他们可能会尝试以速率限制的用户请求的页面或者页面的尺寸缩小。
  • 服务器周期性地运行任务 ;例如 , 一个列表可能会运行一个网站每天 01 : 00 清理所有它的上市 , 可能会影响服务器性能。

他们的足迹 , 这些周期性影响会困难重重 ;你可能需要与后端开发人员。

根据你的水平如何 , 你可能不知道该如何带领小组讨论。一个有用的讨论通常讨论怎么通过你请求的技术栈 , 然后看看我们的边界情况。

  • 什么发生在重负载下的服务器 ?
  • 当完成重要任务计划 ?

两个有用信息进入这个对话 :

  1. 这要取决于问题的日志 , 它经常值得尝试重新创建该问题的尝试 , 通过网站的爬行器爬行的速度 / 强度是使用谷歌 , 看看是否能找到 / 引起同样的问题。这并非总是可能的 , 取决于站点的大小 , 但对于一些网站。能够重新创建的问题始终是最好的方式解决它。
  2. 如果你不能过多 , 以提供精确的时间周期上 Googlebot 是注意到了这个问题。这将使开发商的最好机会 , 将发给其他调试日志让他们发生了什么。

如果 Google 能够抓取网页 , 然后我们进入下一个步骤。

5.谷歌确实看见我所看见的吗 ?

我们知道谷歌是正确页面。下一步就是尝试谷歌页面上看到的那样。如果你有 JavaScript 网站你拍你的头可能已经针对这个问题 , 但是 , 即使你有时这可能仍然是一个问题。

我们遵循之前。首先 , 我们要重新创建它一次。以下工具将让我们做到这些 :

  • 取出呈现 &
    • 结果表明 : 在 DOM 渲染图像 , 而是仅返回页面的 HTML 源。
  • 手机测试
    • 显示 : DOM 和渲染的 DOM 渲染返回给你看。
    • 这不仅给你呈现 DOM , 但它还将跟踪控制台的任何误差。

是提取 & 渲染 , 手机测试治具 , 我该从何说起 ?没有真的 , 除了超时 ( 这就是为什么我们会有我们稍后步骤 ! ) 。就在这里全差分的分析其间 , 如果你感兴趣。

一旦我们有了从这些 , 我们与我们通常看到在我们的浏览器。我建议用这样的工具差分检测器比较两种。

我们发现有任何问题吗 ?

如果我们遇到有意义的差异 , 那么在我的经验通常是来自它的 cookie 或 javascript

为什么呢 ?

  • Googlebot 爬行的页面请求之间清除 Cookies
  • Googlebot 与渲染Chrome 41其中 , 不支持所有现代 JavaScript 。

我们可以隔离各单位 :

  • 加载页面没有饼干。这可以简单地通过加载页面清新改名会话并将呈现在 DOM 的 DOM 呈现在我们的普通浏览器。
  • 使用移动工具测试看到的页面与 Chrome 41 和 DOM 的渲染属性相比较 , 我们经常看到的检查内容。

我们可以再一次使用比较像差分检测器使得我们能发现的任何差异。你可能想要使用一个HTML 格式化器为了帮助他们更好的线路。

我们还可以看到 JavaScript 错误使用测试移动友好的工具 , 这可能特别有用如果你对你的 Javascript 。

如果使用这些知识和这些工具 , 我们能否重现 Bug , 那我们就有了能被复制 , 我们更以切换至作为显影剂 , 将获得固定。

如果我们看到这一切正确 , 进行下一个步骤。

6.谷歌真正看到的是什么 ?

可以看到 , 谷歌并不像我们使用该工具重新创建在先前的步骤。为什么呢 ?几个主要原因 :

  • 过载服务器可以有各种奇怪的行为。例如 , 它们可以返回 200 码 , 但是可以具有缺省页面。
  • JavaScript 是网页被爬网的单独渲染可以花费更少的时间和 Googlebot JavaScript 渲染比测试的工具。
  • 通常存在大量的高速缓存中创建网页 , 这会引发问题。

我们至今还没时间讲 !页面不会立刻爬 , 就爬进网页不被索引。

快捷栏 : 什么是缓存 ?

高速缓存通常是一个问题 , 如果你达到了这个阶段。不像 JS , 这不在我们谈论社会 , 因此在一些情况下更多的解释。高速缓存是存储以便它可更快速。

当你请求的网页 , 会计算来生成页面。如果你然后刷新了页面时 , 惊人的浪费 , 只重新执行所有那些计算相同。相反 , 服务器通常将保存在输出和不输出给您重新运行它们。保存输出被称为缓存。

为什么我们需要了解这些吗 ?嗯 , 我们已经进入了杂草 , 所以很有可能是误配置和高速缓存信息的错误被返回给用户。

有很好的初学者对缓存资源 , 更深入。然而 , 我发现本文对高速缓存基础知识是一个比较友好的。它涵盖了一些基本的缓存类型。

我们能看到谷歌如何实际工作的呢 ?
  • 谷歌的缓存
    • 显示 : 源代码
    • 虽然这不会显示你所渲染的 DOM , 它是把 Googlebot 的原始 HTML 页面访问时看到的。你需要检查这个 JS 和禁用 ;否则 , 打开它 , 你的浏览器将运行所有的 JS 的缓存版本。
  • 站点特定搜索内容
    • 结果表明 : 微小的片断的呈现内容。
    • 通过搜索特定词的页面。inurl: url / example. com ”只有 JS 渲染文本”如果你可以看到 , Google 已经索引特定摘录的内容。当然 , 只限于可见文本 , 漏掉了很多的内容 , 但是总比没有强。
    • 更好的是 , 做相同的秩的跟踪器 , 以查看它是否随时间改变。
  • 实际存储的 DOM 渲染
    • : 显示了 DOM 渲染
    • Alex 从 deepcrawl 写节省 Googlebot 从 DOM 渲染。tl ;版本博士 : 谷歌将渲染和 JS 后到端点 , 这样我们就可以把它提交到了 JS - 呈现版本的页面。我们可以将其保存 , 观察了下 , 看什么地方出错了。
我们发现有任何问题吗 ?

再次 , 一旦发现问题 , 去找开发商。这个对话是在意见一致的最后一个 — — 我说过那里仍然适用。

你应该去对其他知识带进这场谈话中配备 : 谷歌如何工作及斗争。而你会知道的技术开发人员 , 您的网站以及它如何的兴建 , 他们可能不知道 google 是怎么工作的。共同地 , 这可以帮助你更快得到答案。

将明显的是该资源的内容或通过 Google 本身。各种资源层出不穷 , 而我发现 , 这两个是更为有用的信息将提供关于第一原则 :

  • 这个精彩的演讲 ,谷歌如何工作 - 保罗 haahr- 听着 , 是必须的。
  • 在最近举行的会议 IO ( John Mueller & Tom Greenway 的有用介绍谷歌如何呈现 javascript。

但经常存在差异说明谷歌将搜索引擎优化 ( SEO ) 以及社会实践中看到。所有实验在 SEO 行业我们在不懈地执行人也可以帮助减轻一些洞察力。实在太多了 , 但这里有两个很好的例子 :

  • 谷歌确实尊重 canonicals JS例如 , 一些不错的 Eoghan Henn 确实挖这里 , Google 表示尊重 canonicals JS 。
  • 如何谷歌索引不同 JS 框架 ?- 另一个很好的例子 , 通过广泛的阅读实验 bartosz góralewicz 去年调查谷歌是如何处理不同的框架。
7.谷歌可能会聚集在你的网站呢 ?

如果我们达到这个点 , 我们很快乐 , 我们网站运行顺畅。但不是所有的问题都能解决就在您的网站 ;有时候你需要放眼广阔景观和它附近的 SERP 。

最常见地 , 就是我要找的。

  • 类似 / 复制内容的网页有问题。
    • 这可能是有意的 (例如重复的内容。(聚合内容) 或无意或意外 “搜集竞争对手网站索引) 。

不管怎样 , 他们几乎总是通过精确搜索的谷歌。即。比较特殊的内容页面和来自搜索引号。

你有没有发现问题 ?

如果你找到其他的精确拷贝 , 那么它们可能会造成问题。

最好的描述概念 “我为你找到了这里的问题是 : 你认为 Google 是聚集在一起 , 类似的 , 只有一个 ?如果是这样 , 这是打吗 ?

这不仅仅是对传统的谷歌搜索。你可能会发现它在 Google 工作 , Google 新闻等。

举个例子 , 如果你是一名中间商 , 你可能会发现内容排名 , 因为有另一个 , 谁更权威经销商始终职位列表相同。

有时你会看到这个一贯和通俗易懂 , 另一些时候可能聚集在随时间改变。在这种情况下 , 你需要的谷歌排名跟踪器的任何财产 , 你看到它。

乔恩 · 恩萧来自 PI datametrics 给一个优秀的谈话对周围可疑通量 (SERP)这是很值得看。

一旦你发现了问题 , 你可能会需要用实验方式分别展示了去了 , 但是最简单的因素通常有 :

  • 去重复的内容
  • 发现你的速度 ( 通常可以提高通过进行 24 小时的所有 RSS 提要的内容 )
  • 降低聚合
8.一些其他可能的嫌疑人

如果你这么远了 , 我们保证 :

  • Google 页面我们可以始终如一地爬行。
  • 我们要把谷歌一致信号的状态的页面。
  • 谷歌是我们的一贯预期渲染页面。
  • 谷歌正在与正确的页面中可能存在的任何副本。

和你的问题还没有解决 ?

它和重要吗 ?

哦 , 芽。

自由雇佣我们 … ?

当我爱到这篇文章的 SEO 问题都列出来 , 这其实并不实用 , 所以 , 这篇文章让我们两个共同原则和陷阱 , 真的不适合在某些地方在回答这四个问题我们上市了。

糟糕的 HTML / 无效

记住 , 你将看到相同的 HTML , 但它可能是无效或错误。Googlebot 爬行和 ( 任何 ) 解决方案以提供已经在 HTML 规范不跟随 , 有时导致奇怪的行为。

最简单的办法是通过目测或 DOM 渲染工具的使用HTML Validator。

W3C 验证器是非常有用 , 但是会出现很多错误 / 警告你都不会在意。最近我的一个线对的哪些是有用的 :

  • 寻找错误
  • 忽略的属性 (不总是 , 但经常是如此) 。

这个典型的例子是打破头。

iframe 是不允许的代码的头部 , 从而将铬和头部的端部开始。不幸的是 , 在它和规范它 , 因为它们能够在谷歌 — — 因此可读。头部码应该在不同的地方。

奥利弗 · 梅森写的好文章 , 解释的更精细版本中悄然打破头。

当有疑问时 ,

不要低估想比较两个事物的线与 DIFF 线的事差分检测器。它适用于一切 , 不过当它这么做的。

例如 , 如果 GOOGLE 突然停止显示标记的特点 , 尝试以不同的版本历史页你可以在 QA 环境中或从时光机。

原 4 回答问题

时间来回答这些问题。这些问题都是我们的客户带来我们在蒸馏。

1.为什么不是 5 星标记表示谷歌产品页面 ?

谷歌看到的呈现标记的服务器和客户端侧渲染标记 ;然而 , 在服务器侧渲染为具有高优先级。

去除所述标记服务器所呈现的标记意味着 5 星开始出现。

2.为什么不显示 Bing 5 星点评页面的标记 , 当将谷歌吗 ?

这个问题来自 schema. org 的提法。

<div itemscope="" itemtype="https://schema.org/Movie"> </div> <p> <h1 itemprop="name">Avatar</h1> </p> <p> <span>Director: <span itemprop="director">James Cameron</span> (born August 16, 1954)</span> </p> <p> <span itemprop="genre">Science fiction</span> </p> <p> <a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Trailer</a> </p> <p></div> </p>

我们对我们的竞争对手 diff 标记和唯一的区别是我们把 https 版本引用的 schema. org 的 ItemType , Bing 来支持它。

C 'mon, Bing 。

3.为什么没有获得索引页的标签索引吗 ?

答案是在这个岗位。这是打破了头。

开发商已经安装了一些高科技的插入头和一个非 - 标准标签。不是 :

  • < 标题 >
  • < 风格 >
  • < 基底 >
  • < 链接 >
  • < Meta >
  • < 脚本 >
  • < noscript >

这导致头部过早的结束和非索引标签挂在那里 , 身体在不读取。

4.为什么网站上任何一页返回 302 约 20 – 50% , 但是仅用于爬虫 ?

这个花了一些时间。这一个老传统网站有两个服务器 , 一个博客 , 一个用于工厂的其他部分。这个问题发生后不久开始移动博客从一个子域 ( blog.client. com ) 于子目录 (client.com / blog / …) 。

在所有的水平表面 ;如果用户请求任何页面 , 这一切看上去很好。爬行的所有博客的 URL 重定向来检查他们会被罚款。

但我们注意到的错误的搜索被标记在控制台中 , 并在全站范围内爬行 , 很多页面时人工核对造成细了重定向环路。

我们使用提取和呈现 , 但是再一次 , 页页都。

最终 , 当博客页面要求非常快速的博客页面后 (其中 , 实际上 , 只有一个履带被足够快速地实现) , 该请求用于非博客页面被发送到博客服务器。

然后这些将被长久遗忘的重定向 , 302 重定向 - 删除博客文章或者其他 URL (Duff) 的根。接着 , 毡被 HTTP 到 HTTPS 重定向规则 301 , 将自网络日志服务器再次请求 , 并维持该回路。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly