Return to site

Google Analytics中的采样指南

当分析存在的所有数据不可行或不切实际时,采样是统计中使用的过程。相反,使用一个随机选择的小子集来保持可管理性。许多分析平台使用某种抽样来控制报告加载时间,在分析采样时似乎有三种思路。有些人对此感到害怕,坚持使用任何报告的非抽样版本。然后有些人对此感到放松,相信统计逻辑。然后,最后,还有一些人没有注意到。

这三个人都被误导了。

抽样不是什么值得担心的事情,但是,特别是在谷歌分析中,它并不总是值得信赖。因此,绝对值得您花时间了解它何时发生,它如何影响您的工作以及如何避免它。

当它发生时

您可以随时告诉我们何时使用抽样,因为每行报告顶部都有这一行:

如果百分比小于100%,则正在进行采样。你会注意到我已经根据超过5亿次会话制作了一份没有任何抽样的报告 - 抽样不仅仅是关于报告中涉及的会话数量。这是关于您要求平台报告的复杂性。对比下面的内容(对于小屏幕截图道歉;我想确保包含整个上下文,因此添加了解释您正在查看的内容的标题):

除了在第二种情况下使用段之外,这两者是相同的。Google Analytics(分析)始终可以像第一种情况一样为顶线总计提供非抽样数据,但特别是细分非常容易提示采样。

通过使用次要维度也可以诱导完全相同的采样水平:

其他一些专业报告也倾向于采用这种级别的采样,最值得注意的是:

  • 电子商务概述
  • “流量报告”

总结到目前为止,我们使用时可以进行抽样:

  • 细分
  • 不止一个方面
  • 某些详细报告(包括电子商务概述和AdWords广告系列)
  • “流量”报道
采样的准确性

在大多数情况下,采样实际上非常可靠。在同一时期采用以下两个有机交通数字,一个取自0.17%的小样本,一个取样不取样:

差异仅为2.4%,来自实际会话的0.17%的样本。有趣的是,当我在较短的时间内(上一季度)重复这种比较时,样本的大小上升到71.3%,但误差幅度非常相似,为2.3%。

当然,值得注意的是,越深入挖掘数据,有效样本就越小。如果您正在查看1%数据的样本,并且您发现报告中有100个会话的目标网页,那么基于1次访问 - 仅仅因为1是100的1%。例如,请执行以下操作:

全年流入Distilled的流量的百分之八是很多,但是我的个人资料页面的有机流量的8%不是,因此我们最终根据45次访问查看报告(上图)。这是否与您有关,取决于您要检测的更改的大小以及可接受的不确定性水平的阈值。这些主题将是熟悉的那些在CRO的经验,但我建议这个工具让你开始,我已经写了一些关键的概念在这里。

但是,在上述情况的极端情况下,你的直觉应该足够了 - 从我/ about / page到/resources /...tup-guide/的点击声称在12个会话中声明功能,并且基于8.11%的会话。由于12大约是100的8%,我们知道这实际上是基于1个会话。不是你想要制定战略的东西。

如果上述任何一个问题涉及到你,那么我将在本文后面提供一些解决方案。无论哪种方式,还有一件事你应该知道。

此处没有采样,但“所有用户”显示的数字实际上只包含38.8%的会话。这是因为有超过1,000,000行的组合(如报告顶部的黄色“高基数”警告所示)和段的使用。这是因为分组为“(other)”的那些行的效果,当段处于活动状态时会隐藏这些行。无论采样是什么,下面行中的数字都将与其他情况一样准确(除了“(其他)”缺失的事实),但该部分总计在有限使用的最高端。

所以,我们现在已经过去了:

  • 采样通常非常准确(在上面的例子中为+/- 2.5%)。
  • 当您在具有高级别抽样的报告中查看小数字时,您可以计算出他们所基于的报告数量。
    • 例如,1%抽样显示100个会话意味着1个会话是报告中数字的基础。
  • 在使用分段时,您应该留意黄色高基数警告。
你可以做些什么呢

通常,可以以不会触发采样的替代方式重新创建所需的关键数据。这主要意味着避免细分和次要维度。例如,如果我们想要查看热门有机着陆页的会话计数,我们通常会使用“目标网页”报告并应用细分。

在上面的报告中,我只是将一个细分应用于着陆页报告,从而产生了抽样。但是,我可以获取相同的数据未采样 - 在下面的例子中,我转而使用“频道”报告并点击报告中的“自然搜索”:

渠道>自然搜索报告,主要维度为“目标网页”,基于100%的会话

这将我带到一个报告,我只关注有机搜索会话,我可以选择我选择的主要维度 - 在这种情况下,登陆页面。然而,值得注意的是,这个技巧无法可靠地运行 - 当我从“源/中”报告开始复制相同的方法时,我仍然最终得到了采样。

类似的技巧适用于自定义细分 - 如果我想创建一个细分以显示我只访问某些着陆页,我可以编写一个正则表达式高级过滤器来复制功能,减少采样的可能性:

其次,您可以使用API​​和Google表格将报表拆分为较小的日期范围,然后汇总它们。我的同事田旺在这里写了这个工具。

最后,还有GA Premium,为了获得这个按钮:

最后,以下是您可以避免采样的方法:

  • 您可以以不同方式构建报告以避免分段或次要维度,从而减少触发采样的机会。
  • 您可以创建重复的视图,以显示您必须查看采样的数据子集。
  • 您可以使用GA API请求大量较小的报告,然后在Google表格中汇总这些报告。
  • 对于大型企业,GA Premium始终可以选择接收非抽样报告。
All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly