回到主页

在预测哪个页面排名更好时,大多数SEO都不比硬币翻转好。你可以吗?

我们希望能够回答有关为什么一个页面超出另一个页面的问题。
“我们要做些什么来超越那个网站?”
“为什么我们的竞争对手在这次搜索中胜过我们?”

这些问题 - 来自老板,客户和潜在客户 - 是许多SEO的日常生活的标准部分。我知道上周我被问到了这两个问题。

可以相对容易地找出使页面更具相关性和针对特定搜索引人注目的方式,并且可以直接思考页面或网站可能更具权威性的方式(即使它不那么简单直接完成) 。但是这些更改或额外链接是否会导致特定排名的实际重新排序?这是一个非常难以回答的问题,具有高度的确定性。

当我们要求几百人选择两页中的哪一页对一系列关键词排名更好时,英国SERP的平均准确率为46%。如果你只是翻硬币,那比你得到的还要糟糕!此图表按关键字显示性能。这非常糟糕:

取消所有排名因素变得越来越难

自从2009年成立以来,我参与了Moz 排名因素调查的每一次迭代。在我们最近的一次会议上(我最后一次在圣地亚哥寻找SearchLove)我谈到过我曾经如何享受它并觉得​​我能够通过调查增加实际价值,但随着复杂性的增加,这些年来的变化情况如何。

虽然我在制定提高整体有机可见度,流量和收入的策略时仍然充满信心,但我不确定哪些个别排名因素将超过特定情况下的其他排名因素。

战略方法着眼于整个网站和关键字组

我的方法通常是根据对排名组合的假设进行缩小和构建业务案例,但最近我一直在思考,因为我认为机器学习应该使谷歌排名更像是一个黑盒子,并导致排名因素在利基之间变化越来越多。

一般来说,“为什么这个页面排名?” 与“这两页中的哪一页排名更好?”相同?

我一直在教自己使用TensorFlow和Keras的深度神经网络 - 我很确定如果我5年后上大学的话,我最终会学习和工作。当我这样做时,我开始考虑如何模拟SERP(这是一组高维非线性关系)。我意识到理解排名因素的试金石 - 因此能够回答“为什么这个页面胜过我们?” - 归结为能够回答一个更简单的问题:

给定两个页面,您能否找出哪一个会超出给定查询的另一个?

如果你能在一般情况下回答这个问题,那么你就知道为什么一个页面胜过另一个页面,反之亦然。

事实证明,人们在回答这个问题时非常糟糕。

我认为以更高的准确度回答这个问题比投币翻转要低得多。正如你从上面我的结果的潜行高峰看到的那样,结果并非如此。估计你可以做得更好吗?跳过去测试并找出答案。

(事实上​​,如果你能找到一种方法来有效地测试它,我想知道它是否会成为下一个moz排名因素调查的一个很好的合格问题。你是否应该只听那些能够回答的专家的意见合理的准确性?请注意,我的测试并不严格,因为你可以通过谷歌搜索关键字作弊 - 这只是为了娱乐目的)。

参加测试,看看你能回答得多好

随着我的好奇心的激动,我组织了一个简单的测试,认为看到优秀的专家SEO实际上是多么有趣,以及看看外行人的表现如何。

我在下面详细介绍了方法论和一些早期结果,但是如果你想跳过并自己测试一下,你可以继续这里。

请注意,为了简化对抗方面,我将让您依赖Google的所有垃圾邮件过滤 - 您可以相信每个网址在其示例关键字中排名前10位 - 因此您选择的是两个网页的排序确定查询的排名,而不是来自Internet上任何域的两个页面。

我没有设计这个是不可取的 - 你可以通过谷歌搜索关键字显然作弊 - 但正如我的老教师常说:“如果你这样做,你只会欺骗自己。”

很遗憾,Google表单似乎已删除了在应用域之外通过电子邮件发送您自己的答案的选项,因此如果您想知道自己的做法,请记下您的答案并将其与正确的答案进行比较(这些答案是正确的答案)从测试的最后一页链接)。

您只需一个关键字就可以尝试一下,或者继续前进,最多可以尝试10个关键字(每个关键字都有一对页面按顺序排列)。请注意,您不需要执行所有操作; 您可以在任何号码后提交。

您可以参加美国(google.com)或英国(google.co.uk)的调查。所有结果都只考虑“蓝色链接”结果 - 即链接到网页 - 而不是通用搜索结果/单盒等。

早期的回应显示了什么?

在发布这篇文章之前,我们将它发送到了@distilled和@moz网络。在撰写本文时,已有近300人参加了测试,并且已经有一些有趣的结果:

似乎美国的问题稍微容易一些

英国的测试似乎有点困难(根据外行的准确性和主观眼睛来判断)。虽然准确性通常会随着英国和美国的经验而增加,但绝大多数英国受访者的表现都比硬币更糟糕:

一些简单的问题可能会扭曲美国的数据

深入研究数据,美国有一些问题绝对不容易(例如,美国关键词[抵押贷款计算器]存在一个问题,即84%的受访者无论经验如何都能做到正确)。相比之下,英国最简单的一个也是抵押贷款相关的查询([抵押贷款比较]),但只有2/3的人做得对(67%)。

通过关键字比较英国结果......

...对于美国关键字的相同图表:

因此,即使美国的总体准确度略高于50%(约56%或大约5/9),我实际上并不相信美国的SERP 通常更容易理解。我认为有很多美国SERP,其人类精确度在40%范围内。

Dunning-Kruger效果正在显示

该达克效应是充分研究心理现象,使人们“未能充分评估其能力水平,”一般的感觉中,他们实际上是很强的(骗子综合症),并在他们的薄弱环节过于自信领域不确定。除了原始预测之外,我还要求受访者对每个网址对的排名给出信心,从1(“基本上猜测,但我选择了我认为的那个”)到5(“我确定我的选择的页面应该排名更好“)。

这种效应在英国SERP上最为明显 - 受访者回答他们确定或相当肯定(4-5)几乎与猜测(1)一样错误 - 并且比那些说他们的人差几乎4个百分点不确定(2-3):

谷歌是否会犯这些错误?

我问过SEO的问题是“你认为哪个页面排名更好?”,而不是“哪个页面更好?”,所以一般来说,大多数结果都没有说明Google是否正在选择正确的结果用户满意度。但是,我确实要求人们与他们的非SEO朋友分享调查,并要求他们回答后一个问题。

如果我有一个足够大的样本大小,你可能会在这里看到一些相关性 - 但请记住,这些是一系列不同的查询,平均受访者可能不会进入目标市场,所以谷歌很有可能知道什么好的结果看起来比他们好。

话虽如此,在我看来,这些结果中有一两个在用户体验术语中显然是错误的,分析为什么“错误”页面排名更好可能会很有趣。也许这将成为后续帖子的主题。如果你想深入了解它,上面的帖子和调查结束时给出的答案都有足够的数据来找到我的意思(我不想破坏那些没有尝试过的人)然而)。如果你深入了解排名因素并提出任何理论,请告诉我。

我们有能力通过机器学习来对抗机器学习

将这个测试组合起来的一个令人失望的事情是,当我制作Google表格时,我知道太多的答案可以公平地测试自己。但我感到安慰的是,我可以做下一个最好的事情 - 我可以测试我的神经网络(好吧,我的模型,由我们的研发团队重构并训练他们收集的数据,我们轻率地称为Deeprank)。

我觉得这很公平; 说明确实说“使用你喜欢的任何工具来评估网站,但请不要通过自己在Google上执行查询来扭曲结果。”神经网络没有接受过这些结果的培训,所以我认为这符合规则。我在英国问题上运行它,因为它是在google.co.uk SERP上训练的,它比硬币翻转更好:

因此,希望更智能的工具可以帮助我们继续回答诸如“为什么我们的竞争对手在这次搜索中胜过我们?”这样的问题,即使Google的黑匣子变得越来越复杂和难以理解。

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的