回到主页

网站搜索引擎优化-在重大变更之前可视化您的网站结构

网站搜索引擎优化

在我们的上一篇文章中,我们研究了一些有趣的方法来可视化您的网站seo结构,以阐明外部链接和PageRank如何流过它。这一次,我们将使用相同的工具,但我们将着眼于主要网站结构更改可能如何影响您的网站。

搜索引擎抓取工具可以部分地根据内部链接的结构和组织方式确定您网站上哪些网页最重要。具有大量指向它们的内部链接的页面 - 包括来自网站导航的链接 - 通常被认为是您最重要的页面。虽然这些并不总是排名最高的页面,但高内部PageRank通常与更好的搜索引擎可见性相关联。

注意:我使用Paul Shapiro创造的短语“内部PageRank” 来指代基于该网站内部链接结构的单个网站中每个页面的相对重要性。该术语可与“页面重量”互换使用。

我将在下面概述的技术可用于考虑内部PageRank如何受到新部分的添加,全局网站导航的重大变化(如下所示)和网站结构或内部链接的大多数重大变化的影响。

了解网站优化的任何重大变更如何可能影响其搜索可见性,对于确定其实施的风险与回报至关重要。这是我在这种情况下最有帮助的技术之一,因为它提供了我们可以参考的数字,以了解页面权重是否(以及如何)受结构调整的影响。

在下面的示例中,我们假设您可以访问临时服务器,并且在该服务器上,您将使用所考虑的调整来托管您的站点的副本。如果没有此类服务器,您可以手动编辑电子表格以反映正在考虑的更改。(但是,为了节省时间,可能需要为测试和开发设置辅助主机帐户。)

值得注意的是,在登台服务器上,只需要模仿结构而不是最终设计或内容。示例:对于我正在处理的网站,我考虑从全局网站导航的下拉列表中删除一个链接块,并用单个文本链接替换该链接块。该链接将转到包含以前在下拉菜单中的链接的页面。

当我在登台服务器上实现此站点结构更改时,我并不担心这是否有任何好处 - 我只是创建了一个包含大量文本链接的新页面,从导航下拉列表中删除了所有链接,并使用指向新页面的单个链接替换下拉列表。

显然,我永远不会把它放到现场 - 但是我对登台服务器的更改模仿了正在考虑的网站结构变化,让我深入了解内部PageRank发布会发生什么(我们将在下面看到)。我会留给设计师让它看起来很好看。

对于这个过程,我们需要三个工具:

尖叫青蛙 - 如果您的网站不到500页,或者您只想大致了解这些变化意味着什么,那么免费版本就可以。
Gephi - 一款免费,功能强大的数据可视化工具。
谷歌分析
那么,整站优化让我们潜入......

收集您的数据
我不想多余,所以我将不遗余力地重新阅读如何使用Screaming Frog抓取和导出您的网站数据。如果你错过了最后一篇,详细解释了这个过程,你可以在这里找到它。

爬网完成并且您拥有站点数据后,只需导出相关数据,如下所示:

批量导出>响应代码>成功(2xx)链接

您将对实时站点和临时站点(具有调整结构的站点)执行此操作。下载完两个结构后,您需要为Gephi格式化它们。Gephi需要创建可视化的全部内容是了解您的网站页面(“节点”)以及它们之间的链接(“边缘”)。

注意:在我们准备好数据之前,我建议在暂存CSV文件中执行查找和替换,并将暂存服务器域/ IP替换为实际站点。这将使您在以后的步骤中更容易使用和理解。

由于Gephi不需要Screaming Frog导出的大量数据,我们将通过执行以下操作从这些CSV文件中删除不需要的内容:

删除包含“Success(2xx)Inlinks”的第一行。
将“目标”列重命名为“目标”。
删除除“Source”和“Target”之外的所有其他列。(注意:在删除之前,您可能希望通过Type列快速排序并删除任何未标记为“AHREF”的内容 - CSS,JS,IMG等等 - 以避免污染您的可视化。)
保存已编辑的文件。您可以根据自己的喜好命名。我倾向于使用domain-live.csv和domain- staging.csv。
 

我们想要的第三组数据是从Google Analytics导出我们的有机着陆页。您可以使用不同的指标,但我发现在考虑结构更改对页面权重的影响时,可以直观地了解哪些页面对我的自然流量负有最大责任。基本上,如果您发现负责大量流量的页面会降低内部PageRank,您将需要了解并相应地进行调整。

要将此信息添加到图表中,只需登录Google Analytics,然后在“行为”下的左侧导航栏中,转到“网站内容”并选择“目标网页”。在页面顶部的细分中,移除“所有用户”并将其替换为“有机流量”。这会将您的目标网页数据限制为仅限您的有机访问者。

展开数据以包含任意数量的行(最多5,000个),然后将数据导出为CSV,这将为您提供以下内容:

删除前六行,使标题行以“着陆页”标签开头。然后,滚动到底部并删除累积的总计(页面下方的最后一行),以及“日期索引”和“会话”数据。

请注意,您需要此电子表格中的目标网页网址与Screaming Frog CSV文件中的源网址格式相同。在上面显示的示例中,“登录页面”列中的URL缺少协议(https)和子域(www),因此我需要使用“查找和替换”来添加此信息。

现在我们准备好了。

获取当前站点的可视化

第一步是上传您当前的网站页面地图 - 也就是说,让Gephi知道您拥有哪些网页以及链接到哪些网页。

首先,打开Gephi并转到File> Import Spreadsheet。您将选择实时站点Screaming Frog导出(在我的情况下,为yoursite-live.csv),并确保将“As table:”下拉列表设置为“Edges table”。

在下一个屏幕上,确保您已选中“创建缺少的节点”,这将告诉Gephi为您输入的“边缘表”(读取:链接映射)创建节点(读取:页面)。现在你已经得到了你的图表。不是很有用吗?

好吧,不是真的 - 但它会。下一步是在那里获取Google Analytics数据。因此,让我们前往数据实验室(在顶部按钮中)并执行此操作。

首先,我们需要导出页面数据。当您在数据实验室时,请确保您正在查看节点数据并将其导出。

打开CSV时,它应包含以下列:

  • ID(包含您的网页网址)
  • 标签
  • Timeset

您将添加第四列,其中包含您要从Google Analytics中提取的数据,在我们的示例中,这些数据将是“会话”。您需要临时向CSV添加第二个工作表,并将其命名为“analytics”,其中您将更早地从分析导出中复制数据(基本上只是将其移动到此工作簿中)。

现在,我们要做的是使用来自分析的实际会话数据填充Sessions列。为此,我们需要一个公式来查看第一张中的节点ID并在第二张表中查找相应的登陆页面URL; 当它找到它时,它应该在适当的时候将该页面的有机流量会话插入Sessions列。

可能我最常用的Excel脚本可以解决这个问题。在您创建的“会话”列的顶部单元格中,输入以下内容(粗体数字将根据您在分析导出中的数据行数而更改)。

= IFERROR(分析!$ B $ 2:$ B $ 236,MATCH(A2,分析!$ A $ 2:$ A $ 236,0),1),“0”)

完成后,您将需要复制Sessions列并使用“粘贴值”命令,该命令将单元格从包含公式切换为包含值。

现在剩下的就是将新工作表重新导入Gephi。将电子表格保存为data-laboratory-export.csv(如果您愿意,可以只保存nodes.csv)。使用Data Laboratory中的Import功能,您可以重新导入文件,该文件现在包含会话数据。

现在,让我们从Data Laboratory选项卡切换回Overview选项卡。目前,它看起来几乎与以前相同 - 但即将改变。首先,让我们应用一些内部PageRank。幸运的是,基于最初的Google专利计算,GeR内置了一个PageRank功能。它并不完美,但它可以让您了解内部页面重量流程的作用。

要完成此操作,只需单击右侧面板中“PageRank”旁边的“运行”按钮即可。您可以保留所有默认值。

接下来你要做的是根据会话数量对节点(代表你的网站页面)进行颜色编码,并根据他们的PageRank对它们进行大小调整。要执行此操作,只需在左上角的“外观”窗格下选择节点的调色板。从下拉列表中选择会话,然后选择您喜欢的调色板。选择设置后,单击“应用”。

接下来,我们将对PageRank做同样的事情,除了我们将调整大小而不是颜色。选择大小调整工具,从下拉列表中选择PageRank,然后选择最大和最小大小(这将是基于页面重量的相对大小)。我通常分别从10和30开始,但你可能想要玩它们。选择所需设置后,单击“应用”。

可视化的最后一步是在左下方面板中选择布局。我为此目的喜欢“Force Atlas”,但可以随意尝试。这给了我们一张如下所示的图片:

您可以轻松地引用哪些页面没有自然流量,哪些页面的颜色最多 - 通过右键单击它们,您可以直接在数据实验室中查看它们以获取其内部PageRank。(在这种情况下,我们可以了解最高流量页面之一是PageRank为0.016629的产品页面。)我们还可以看到我们最常被访问的页面是如何聚集到中心的,这意味着它们之间存在很大关联网站。

现在,让我们看看新结构会发生什么。你需要完成上面的相同步骤,但是从登台服务器导出Screaming Frog(在我的例子中,是domain-staging.csv)。我不打算让你通读所有相同的步骤,但这是最终结果的样子:

我们可以看到这个版本中有更多的异常值(内部链接中的页面通常会大大减少)。我们可以通过右键单击它们并在数据实验室中查看它们来调查这些页面,这将帮助我们找到可能出现的意外问题。

我们还有机会看到上面提到的高流量产品页面发生了什么。在这种情况下,在新结构下,其内部PageRank转移到0.02171 - 换句话说,它变得更强。

有两件事可能导致内部PageRank增加:页面链接数量增加,或者链接到其他页面的数量减少。

从本质上讲,页面可以被视为拥有100%的PageRank。尽管谷歌通过每个链接减少了PageRank或者按页面上的位置加权,但是PageRank通过链接流向其他页面,并且“链接汁”在链接之间分开。因此,如果页面上有10个链接,则每个链接将获得10%。如果将链接总数减少到五个,那么每个链接将获得20%。

同样,这是一个相当简化的解释,但这些增加(或减少)是我们想要衡量的,以了解拟议的网站结构更改将如何影响我们最有价值的有机页面的内部PageRank。

在数据实验室中,我们还可以通过他们的PageRank订购页面并比较结果(或者只看我们当前的结构如何运作)。

和…

这只是冰山一角。我们可以将有机会话替换为我们导入的基于页面的数据中的排名(或者疯狂并包括两者)。通过这些数据,我们可以判断站点结构转换中排名(或即将到来)页面的PageRank会发生什么。或者像我们在上一篇文章中所做的那样考虑传入的链接权重,看看它的传递是如何受到影响的?

虽然没有任何工具或技术可以让您100%确保结构变更始终按计划进行,但这种技术有助于捕捉许多意外问题。(记住:看看那些异常值!)

此练习还可以通过隔离页面来帮助解决意外的机会,这些页面会因建议的网站结构更改而获得页面权重。您可能希望在网站建设结构更改生效之前(重新)优化这些页面,这样您就可以提高排名提升的机会。

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的