Return to site

如何在Google表格中使用REGEX公式

· seo优化

如果你在SEO工作,处理大量数据进行分析是很正常的。在Google表格或Excel中,我会定期使用vlookup ,index, iferror 等公式,然后继续列表,以便快速排序无休止的数据。不仅是他们根本对我的生存的SEO分析师,我经常还是要参考蒸馏Excel的指南,以达到我想要的。但有时候,这些功能还不够好。他们会做这项工作,但是设置它们所花费的时间让我怀疑自己是否真的工作得更快。

感谢Robin Lord最近在Distilled举办的数字营销Meetup活动中所做的精彩演讲,我被介绍到了Regex的世界。正则表达式是一个匹配的表达式工具,返回特定的值,例如,true或false,无论它是否找到表达式。它可以在许多平台上使用,例如Google Analytics,Python,Java等,以执行特定字符串的搜索。

你可能会想“哦,不,我不理解的另一种复杂的编程语言使事情复杂化”。你不能错。好消息是,您可以在Google表格上使用Regex处理您的数据,让您的生活变得轻而易举。这是对的,我所有关于学习工具,让我的生活更轻松,最近Regex是我的最爱。

您可以在Google表格中使用的3个主要正则表达式公式为:

REGEXEXTRACT
REGEXREPLACE
REGEXMATCH
它们完全按照他们的说法执行:提取,替换和匹配。由于我的目的是展示这些函数的有用性,因此我不会深入研究所有Regex语法规则。已经有很多全面的指南和资源,所以如果你想了解更多Regex,这是一个有用的Regex指南,这是一个非常好的调试工具。

下面我将深入研究Google表格的正则表达式公式以及如何使用它们的示例以及每个公式可以实现的目标。

REGEXEXTRACT
当您在较长的字符串中挖掘某个字符串时,这是您想要使用的功能。对于我的一个客户,我有一个URL列表,我必须在每个内容中提取某些单词。例如,从下面的URL列表中我们假设我必须提取位置:

https://www.regexisgreat.co.uk/city/in-london
https://www.regexisgreat.co.uk/location/in-paris
https://www.regexisgreat.co.uk/cities/in-dublin
https://www.regexisgreat.co.uk/europe/in-amsterdam
但是,我找了很多单词,每个URL都可以包含其中的任何一个,并且位于URL中的不同位置。如果没有Regexextract,我必须为每个URL应用多个过滤器和自定义公式,根据其位置提取单词。我没时间做这个,也不应该。

让我开始讲一个非常简单的Regex示例。假设我需要从“http://regexisgreat.com”链接中提取“好”这个词。当您在Google表格中输入“= REGEXEXTRACT”时,这就是该功能所需的内容:

“text”部分是您需要查找的单元格,“regular_expression”是告诉Regex要查找的内容的表达式。在我们的例子中,公式将变为:

这里有一个小语法上下文:。*之前和之后的单词“great”告诉Regex不要担心字符串 “great” 之前或之后的内容。所以“伟大”可以在URL中的任何地方,Regex会找到它:

这是一个正则表达式的示例,如果您要查找多个值,公式将成为什么:

= REGEXEXTRACT(A3,” *(蓝色|绿色|红色|紫色|。金发)*”)

在这里你可能注意到使用了管道“|”代表“或”。该公式告诉Regex寻找蓝色或绿色或红色等字样。

同样,单词在字符串中的位置无关紧要。另外需要注意的是,正则表达式区分大写字母,有时可能非常方便。

当您认为可以将它与您每天使用的功能结合使用时,此公式的应用是无限的。即使没有将REGEXEXTRACT与任何其他公式相结合,执行上面显示的任务也不会非常耗时。

REGEXREPLACE
对于我的一个客户,我有很长的标题标签列表,我想把每个单词的第一个字母大写,除了“a”,“in”,“for”,“a”之类的单词,你明白了。使用公式PROPER,您可以将单词的每个首字母大写:

但这并没有解决我的问题。Regexreplace 来救援:

= REGEXREPLACE(适当的(A4), “所述”, “该”)

与Regexextract类似,“text”部分是您要修改的单元格,剩下的部分是一个简单的指令,告诉Regex要替换的内容:

以下是Regexreplace与自身结合的示例:

= REGEXREPLACE(REGEXREPLACE(适当的(A4), “所述”, “该”), “以”, “中”)

REGEXMATCH

Regexmatch在单元格中搜索值并返回TRUE或FALSE。对我来说,当我检查列表中的URL是否包含某些单词并且我不想通过无限过滤器时,这变得很有用。

这是一个简单的Regexmatch示例,在URL中查找“blue”一词:

= REGEXMATCH(正确的(A3), “蓝色*。*”)

这是一个示例,显示了Regex如何区分大写字母:

同样,在这里您可以使用多个值在相同的公式中查找:

= REGEXMATCH(正确的(A3), “*蓝|。蓝*。”)

Regexmatch的应用程序很多,您可以将它与Google表格上的任何其他功能结合使用。

您可能已经注意到,这三个简单功能的潜力无穷无尽。我们不要忘记,Regex上有更多的语法规则可以用来实现不同的东西。这是一个额外的调试工具,适合那些想要使用Regex进行编码的人。

正则表达式使我的生活变得更轻松,我的数据更有趣。我相信你会发现它非常有用并且非常容易学习。如果您对公式或进一步的建议有任何疑问,请随时发表评论。保持冷静和REGEX!

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK