Return to site

出汗细节 - 重新思考Google关键字工具卷

数据科学家和项目经理团队带来了他对一个精致而全面的SEO关键词工具的广阔视野......现在,我。

我希望能够轻松完成我的驾驶室项目,所以当关键字资源管理器中的“音量”指标作为我能够工作的东西时,我就跳上了它。在我看来,我完成了第二件工作是提供给我的。我已经拥有了一个巨大的关键字卷数据库,一个可以启动的爬行平台。我所要做的就是将一些字符串绑在一起,瞧。

同辈压力

起初它很微妙,从不直接,但我很快就开始看到Moz看待问题的方式有所不同。我一直都是一个懒惰的实用主义者 - 当我需要一把锤子时,我会四处寻找一些难的东西。这是快速近似的一个有用的技能组合,但是当你有几个月的时间来做正确的事情时,这有点是一种负担。

Moz并不是在寻找使用而不是锤子的东西; 他们正在寻找完美的锤子。他们正在仔细审查指标,按钮,工作流程......我记得有一个特别超现实的讨论围绕在Web应用程序中映射键盘快捷键来模仿Excel中的那些。因此,在我第一次尝试时,我出现在一个计划会议上,基本上是Google Keyword Planner卷的克隆,我应该已经看到了它。他们很有礼貌,但我能感觉到 - 这并不是更好,Moz要求他们的工具更好。有时同伴压力是一件好事。

如果没有损坏,请不要修理它。

毫不奇怪,兰德是第一个质疑体数据是否准确的人。我的回答一直是懒惰的实用主义者:“这是我们得到的最好的。” 其他人随后也提出了同样有效的问题 - 用户如何根据这些数据进行分组?我们有多少钱?为什么要给客户一些他们可以免费获得的东西?

尾巴夹在我的膝盖之间,我觉得是时候抽出细节了,从问题开始:“什么坏了?” 这是研究背后的推动力,导致关键词计划者的肮脏秘密上的这篇文章,概述了谷歌关键词计划数据的众多问题。我会在这里饶有你的详细信息,但是如果你想了解Rand为什么是正确的背景以及为什么我们确实需要对传统的关键词量指标进行思考,请看看那篇文章。

这只是其中一个问题 - Google Adwords搜索量会将关键字放入批量存储区而不会告诉您范围。

好吧,它破了。是时候出汗了!

一旦我清楚地知道我不能仅仅反复谷歌的数字并假装它们是事情的规范真相,那么现在是时候开始通过音量指标来询问我们想要回答的基本问题了。在与Keyword Explorer工作的许多人的讨论中,我们发现了良好的量度量的四个不同特征。

  1. 特异性:良好的量度量的核心是特定于实际的平均搜索量。您希望卷号尽可能接近现实。
覆盖范围:数量因月而异,因此您不仅希望它与所有月份的平均值相关,而且希望它特定于每个月。良好的数量指标将为您提供一年中每个月的合理预期 - 而不仅仅是全年除以12。

新鲜:良好的数量指标将考虑趋势并调整到与过去12个月不同的统计上显着的变化。

  1. 可重复性:良好的量度量应该允许您在关键字的数量相似时将它们相互关联(即:分组)。

我们实际上可以将这四点应用于Google关键字规划师,看看它的弱点......

  1. 特异性:谷歌的关键字数量是每月四舍五入的平均值的平均值
  2. 覆盖范围:对于大多数关键字,平均每月搜索量仅为当年月份的33%。大多数月份,实际数量将落在与月平均搜索量不同的数量桶中。
  3. 新鲜:关键字规划师每月更新一次,平均值不提供预测值。一个热门的新关键字在平均每月搜索中看起来是实际音量的1/12,并且它不会显示30天。
  4. 可重复:您可以在84个不同的卷桶中的一个中对关键字进行分组,而无需解释组的形成方式。(它们似乎与简单的对数曲线相关联。)

你可以看出为什么我们担心。这些数字并不是那么具体,大多数时候都有字面错误的范围,经常更新但不经常更新,而且不是很容易组合。好吧,我们为我们做了工作,所以我们开始认真地解决问题......

平衡特异性和覆盖范围

可以想象,在特异性和覆盖范围之间存在直接的权衡。体积范围越小,特异性越高,覆盖率越低。范围越宽,特异性越低,覆盖度越高。如果我们只有一个从零到十亿的范围,我们将具有可怕的特异性和完美的覆盖范围。如果我们有数百万个范围,我们将具有完美的特异性,但没有覆盖范围。鉴于我们的权重和参数,我们确定了最佳安排。我很确定这个问题的数学表达式可以在这里做得更快,但我不是一个聪明的人,所以我使用了我最喜欢的工具:蛮力。这个想法很简单。

  1. 我们采用Google关键字规划师提供的搜索量数据的最大和最小边界,假设...介于0到10亿之间。
  2. 然后我们将其随机分成范围 - 测试合理数量的范围(介于10到25之间)。想象一下,在书架上的书之间随意放置分隔线。我们这样做了,除了书籍是关键词卷号。
  3. 我们为特异性的重要性(从关键字的实际平均每月搜索的最小和最大范围的平均值之间的距离)分配权重。例如,我们可能会说80%的重要性是我们接近今年的平均水平。
  4. 我们为覆盖的重要性(过去一年中任何给定月份的可能性落在该范围内)赋予权重。例如,我们可能会说,我们接近每个月的平均值是重要的20%。
  5. 我们会根据随机选择的范围测试100,000个随机选择的关键字及其Google Keyword Planner卷。
  6. 我们使用过去12个月的实际平均值,而不是过去12个月的舍入平均值。
  7. 我们为数百万随机选择的范围执行此操作。
  8. 我们从表现最好的人中选出获胜者。

运行花了几天(我们运行的时间越长,发现的稀有新赢家)。最终,我们确定了20个不同的范围(用于分组和显示目的的一个不错的整数),使覆盖率比原先存在的Google Keyword Planner数据增加了一倍多,同时尽可能减少对特异性的损害。让我举一个如何有用的例子。我们来看一下关键词“棒球”。尽管季节很长,但它相当季节性。

在上面的示例中,Google平均每月棒球搜索量为368,000。涵盖的范围在330K到410K之间。如您所见,此范围仅涵盖12个月中的3个。Moz系列涵盖12个月中的10个。

现在,想象一下,你是一家正在计划明年PPC和SEO营销的零售商。您可以根据Google关键字规划师提供给您的368,000号码进行预测。实际上,你在一年中的平均8个月表现不佳。这是一个难以吞咽的药丸。但是,使用Moz范围,您可以使用下边界作为“最坏情况”。使用Moz系列,您的流量在一年中只有2个月不足。当我们知道确切的平均值几乎总是错误时,为什么假装我们可以得到精确的平均值?

提高相关性

这自然地来自我们的平衡特异性和覆盖范围。为了美观和可用性目的,我们最终选择了20个分组而不是一些性能较差的分组,这些分组的数据不太清晰(如21个分组)。但这意味着按容量分组关键字很容易,而不是以任意方式。如果需要,您可以始终按Excel中的范围进行分组,但是您想到的范围不会以任何方式验证基础数据。

让我举一个例子,为什么这很重要。直觉上,你可以想象,随着它们变大,范围会以类似的对数方式在宽度上增加。例如,您可能认为大多数关键字都是10%易失性,因此如果关键字每月搜索100次,您可能会预计几个月为90,其他为110.同样,您可能希望每月搜索1000次关键字上涨或下跌10%。因此,您可以创建0-10,100-200,1,000-2,000等范围。事实上,这似乎正是Google所做的。它简单而优雅。但这是对的吗?

不。事实证明,关键字数据并不一致。它通常遵循这些模式,但并非总是如此。例如,在我们的分析中,我们发现虽然101-200之后的体积范围是201-500(宽度增加3倍),但下一个最佳范围实际上是501-850,宽度仅增加1/6。

这可能是由于与某些关键字相关的非随机人类搜索模式。人们可能每天,每周,每月,每季度搜索一些关键词。想象一下像“本月的第一个星期一是什么”和“本月的最后一个星期二是什么”这样的关键词。所有这些关键词都会被类似的人口搜索相似的次数,每个月的次数相似,从而产生非随机的一致性。这些模式会导致术语的波动性发生变化,如果数据真的是随机的,那么这些术语的波动性与您期望的自然对数标度不一致。我们的机器学习量范围可以有效地捕获这种非随机的人类行为。

我们实际上可以在图表中很容易地证明这一点。

请注意,此图表中Google的关键字规划器卷范围的日志几乎是线性的,但尾端除外。这表明Google在尝试解决使数据非随机的搜索行为模式方面做得很少。相反,它们将一个简单的对数曲线应用于它们的音量桶并保留它。R 2值显示这种关系有多接近1(完美线性)。

Moz的关键字体积范围的对数远不如线性,这表明我们的范围优化方法发现搜索数据中的异常不符合与搜索量波动率的完美对数关系。这些异常很可能是由人类搜索行为中的真实非随机模式引起的。查看Moz图中的位置11和12。我们的范围实际上在第12位收缩,然后在第13位跳回。有一个真实的,数据确定的异常,显示该范围内的搜索实际上比前一范围内的搜索具有更小的波动性,尽管经常被搜索。

提高新鲜度

最后,我们通过使用全新的thirrd-party匿名点击流数据集来提高新鲜度。是的,我们分析了1小时延迟的点击流数据,以捕获值得包含在我们的体积数据和语料库中的新关键词。当然,这本身就是一个壮举; 我们必须每天将数亿个事件解析并清理成可用数据。此外,搜索量的许多统计上显着的变化实际上是短暂的。谷歌涂鸦因此而臭名昭着,导致一天内晦涩难懂的关键词流量大幅增加。我们随后建立了模型,以寻找在一系列日子里呈现上升趋势的关键词,超出预期值。然后,我们使用预测模型将点击流搜索量映射到最低四分位数范围(即:

最后,我们必须从点击流数据集本身中删除固有偏差,以便我们确信我们的新数据是可靠的。我们通过......完成了这个

  1. 创建一个从点击流数据预测Google Keyword Volume的天真模型
  2. 对点击流关键字进行标记并发现与异常值相关的单词和短语
  3. 构建这些令牌的令人沮丧和增强的地图,以根据其包含来修改预测模型
  4. 将地图应用于幼稚模型,为我们提供更好的预测。

这是一个非常成功的尝试,因为我们可以采用原始点击流数据,并且在给定某些先决条件(4周稳定数据)的情况下,我们可以95%的准确度预测适当的体积范围。

单一指标

以上所有内容 - 对谷歌关键词规划师不合适的原因,机器学习范围,每日新鲜量更新等的研究 - 都只是一个看似简单的指标:体积范围。这可能是我们对指标的最少审查,因为它是最直接的。关键字难度,有机点击率和关键字优先级经历了更多修订,并且在其方法,分析和生产方面更为复杂。

但我们还没有完成。我们正在积极寻求通过添加更多更好的数据源来改进数量指标,预测未来流量,并可能提供范围和范围。我们感谢您提供的任何反馈,以及针对不同样式的量度量标准的用例

然而,在一天结束的时候,我希望你得到的是这样的:在Moz,我们为了你没有必要的细节。

个人笔记

这是我在Moz的第一次重大发布会。虽然我非常想念Angular(我过去10年为之工作过的咨询公司)的朋友和同事,但我不能说我在这里工作的人很多。他们中的大多数人永远不会在这里发表博客,不会发推文,也不会在会议上发言。但他们应该得到所有的信任。所以,这是我在关键字资源管理器会议中通过Google Hangouts查看的视图。大多数团队都能够成功,但那些没有,你知道你是谁。谢谢你出汗的细节。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly