回到主页

如何将个人身份信息保留在Google Analytics之外

2018年5月,欧盟的通用数据保护条例(GDPR)生效,引起营销人员的恐慌,每个人的收件箱都挤满了更新隐私政策的公司发来的电子邮件。营销人员必须意识到的一个主要方面是分析的含义。GA在数月内(默认为26个)对数据保留带来了新的限制,并且所有分析和跟踪工具对收集的个人身份信息更加敏感。

如果您向Google Analytics发送个人身份信息,会发生什么
然而,无论GDPR如何,Google Analytics都有一段时间禁止向GA 发送个人身份信息(PII)。潜在风险很高:如果发现您的GA帐户违反了此政策,则指南指定:

“如果您使用任何此类信息,您的Google Analytics帐户可能会被终止,您的数据也会被销毁。”

Google Analytics 文档指定了它计为PII的数据类型。这包括:

电子邮件地址
邮寄地址
电话号码
全名或用户名
重要的是,这适用于过去收集的数据。这意味着,如果您在GA帐户中意外(或有意)收集了电子邮件地址,全名或电话号码,则整个帐户和所有历史数据都有被删除的风险。这比您想象的更常见 - 绝对值得检查您的所有GA帐户。这就是为什么如果您认为自己面临违反服务条款的风险,那么备份GA帐户中的任何历史数据也很重要。

这也适用于在视图级别过滤掉的数据。这意味着,如果您在Google Analytics点击中发送电子邮件地址等PII,但使用GA界面中设置的过滤器对其进行过滤,则您仍然违反了GA服务条款。

了解您是否在GA收集PII
如果您要将PII发送给GA,您可能会将相同的信息发送到Adwords,Doubleclick,Bing,Facebook,Optimizely,Hotjar等等,等等 - 在任何分析,跟踪或再营销工具上实施您的网站是潜在的PII漏洞。

这个云的一大优势是,AdWords团队倾向于更积极地与广告客户进行沟通,而不是GA - AdWords团队可能会发现您正在做的事情并向您发出警告。Adwords服务条款以及DoubleClick与PII上的Google Analytics具有类似的规则,违反这些条款的后果是删除对再营销等Adwords功能的访问权限。我在本文后面概述的修补程序将阻止PII被发送到Adwords和DoubleClick以及任何其他营销代码,只要它们通过Google跟踪代码管理器被解雇。

与无意中发送到Google Analytics的电子邮件地址等PII频率相比,此Adwords通知很少见。最常见的方式是通过包含电子邮件地址,电话号码或用户名的URL参数。

为了查找您网站上是否发生这种情况,您应该提取行为>网站内容>所有页面报告,并使用自定义过滤器作为“@”符号(在尽可能宽的时间段内)。这将取消您网站上访问过的包含该符号的所有网址。

如上所述,如果您已将PII发送给GA,则您的GA帐户和数据将被删除,在这种情况下,您最好备份数据。我的同事Dom Woodman一直在开发一个python软件包,用于从API下载数据并将其上传到Google BigQuery - 这不是GA中每次点击的完整备份,但是可以让您记录关键指标和尺寸,以防万一发生。在Twitter上关注Dom,在它准备就绪时听到更多相关信息。

一旦您停止将PII发送到GA,最好创建第二个干净GA帐户(而不是属性或视图)以开始收集数据而不会丢失该数据的风险。遗憾的是,只有在设置完成后才能对数据进行此操作,因为无法将数据追溯加载到GA中。

防止PII被发送到GA
注意:此解决方案需要了解Google跟踪代码管理器(GTM)和javaScript。我强烈推荐Simo Ahava的博客给任何学习如何使用GTM的人 - 他写了几篇关于GTM主题的最佳文章。

此解决方案适用于使用Google跟踪代码管理器在其网站上实施Google Analytics(以及任何其他跟踪工具)代码的任何人,可以通过自定义HTML代码或内置的Universal Analytics代码。

其他人(包括Simo Ahava和Brian Clifton)过去曾推荐过类似的解决方案:他们的方法是覆盖发送给GA的页面路径变量。虽然这种方法确实有效,并且是防止PII到达GA的好方法,但它依赖于针对您在GTM中使用的每个不同跟踪标记修改的变量,而默认情况下,此处概述的方法将适用到GTM容器中的每个跟踪标记。

我的方法的工作方式是通过以下步骤:

重写URL以删除任何违规参数并编辑电子邮件地址
使用history.replaceState()更改浏览器中的URL
重写页面标题以删除任何电子邮件地址
将自定义事件发送到DataLayer
触发此自定义事件的所有跟踪代码。
在GTM中,这样做的方法是引入新标签,新触发器和新变量。我将在下面概述其中的每一个。

标签
此修复程序中使用的新标记是自定义HTML <script>标记,应在页面视图中触发该标记以加载所有页面。此标记执行上述前四个操作:

重写URL以删除任何违规参数并编辑电子邮件地址
首先,它从URL中提取所有URL参数
然后检查这些参数以查看它们是否已列入白名单(参见下文) - 如果参数不在白名单中,则该参数将被删除。
如果参数列入白名单,则使用正则表达式(正则表达式)检查参数的值以查找电子邮件地址。如果此正则表达式找到一个电子邮件地址,它将替换为“EMAIL_REDACTED”
使用history.replaceState()更改浏览器中的URL
如果对URL参数进行了更改,则代码将使用javaScript历史记录API更新浏览器中的URL。重要的是,此时没有标记被触发,这就是为什么需要为GTM中的所有跟踪标记更改触发器的原因。
这具有使URL更清晰且更可共享的第二个好处,并确保链接更可能是规范版本的URL。
重写页面标题以删除任何电子邮件地址
该代码还使用与上面相同的正则表达式检查页面<title>标签中的电子邮件地址。
如果找到电子邮件地址,则电子邮件地址将被“EMAIL_REDACTED”覆盖
将自定义事件发送到DataLayer
完成上述操作后,将发送名为“parametersRemoved ”的DataLayer事件,该事件可用于触发其他标记。
 

触发器
上面的代码运行后,如果页面包含PII,则页面的URL和标题将会更改,并且所有电子邮件地址都将被删除。现在可以安全地将跟踪信息发送到Google Analytics和其他跟踪工具。

为此,请为所有跟踪代码设置自定义触发器。这些触发器应替换您通常用于分析标记的标准网页浏览标记,以确保在发送跟踪匹配之前删除PII。触发器应在自定义事件上触发,名称为“parametersRemoved”。

如果仅在某些页面上触发某些标记,则可以创建多个触发器。例如,您可以为仅在某个子域上触发的标记添加主机名过滤器。

白名单参数变量
为了不丢失重要的标记和跟踪信息,制作参数白名单非常重要。这将包含一个javaScript数组,其中包含跟踪GA等工具需要查看的所有URL参数。

此列表将根据您网站的功能及其分析设置而有所不同,但通常应包括:

utm_source
utm_medium
utm_campaign
的utm_content
GCLID
网站搜索参数(例如“搜索”或“q”)
联盟跟踪参数
此参数列表应设置为Custom JS GTM变量,该变量返回一个数组。请参阅下面的示例:

要使标记起作用,必须将此变量命名为“parameterWhitelist”。

当这不起作用
重要的是要注意,此修复仅在某些情况下有效。它不会从使用页面代码(包括gtag.js)而不是通过GTM触发的任何跟踪标记中删除PII,并且它不适用于使用pageview触发器触发的任何GTM标记。

上面的代码版本也只检查电子邮件地址。删除非白名单参数通常会处理大多数其他形式的PII,但仍有可能在GA中跟踪电话号码,姓名和邮政地址等内容。如果是这种情况,则需要在您的网站上采取更深层次的措施来防止这种情况发生。

加起来
随着GDPR的生效,数字营销的每个人都需要更加警惕他们收集的数据以及存储的位置。对于Google Analytics中的PII,这是一个特定的,稍微粗略的解决方案,但如果这些问题很可能是网站或公司对用户数据的更广泛态度的问题。

如果您想确保不会冒GA数据风险,请执行以下操作:

通过检查URL和标题中的电子邮件地址来确定您是否正在收集PII
备份您的GA数据
实施GTM修复程序以停止向GA和其他跟踪工具发送PII
创建一个干净的GA帐户,以防万一发生
请在评论中告诉我您对此方法的看法,以及您是否有任何其他提示可以保持您的网站及其分析符合GDPR标准。

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的