Return to site

TechSEO Boost:SEO的机器学习

· seo优化

今年的TechSEO Boost是一项致力于技术搜索引擎优化并由Catalyst主办的活动,于11月29日在波士顿举行。

作为“面向开发人员和高级搜索引擎优化专家”的会议,TechSEO Boost建立在2017年首届活动的成功基础上,通过一天的启发,挑战行业中最敏锐的人才。

有些话题全天都渗透到话语中,特别是机器学习是一个反复出现的主题。

正如TechSEO Boost会议的本质一样,这些会议旨在超越炒作,以定义精确的机器学习对于SEO,无论是现在还是将来。

以下是Moz高级搜索引擎优化科学家布兰妮·穆勒(Britney Muller)的精彩演讲的回顾,题为(恰如其分)“机器学习为SEO”。

什么是机器学习?快速回顾一下。
会议开始时简要介绍了适合“机器学习”保护伞的关键术语和概念。

Muller使用下图中的定义将机器学习的感觉理解为“AI(人工智能)的一个子集,它结合了统计和编程,使计算机能够”学习“而无需明确编程。

当我们考虑如何将机器学习应用于日常SEO任务时,从新刺激中“学习”的核心思想是一个重要的思路。

机器学习擅长识别大量数据中的模式。因此,今天机器学习应用程序的一些常见示例包括:

推荐系统(Netflix,Spotify)
共享应用程序(Uber,Lyft)
数字助理(亚马逊Alexa,Apple Siri,Google智能助理)
然而,这种无处不在可以使它成为一个具有挑战性的概念。事实上,谷歌的埃里克施密特甚至说,“谷歌正在研究的核心问题基本上是机器学习。”

将其分解为构成典型机器学习项目的步骤是有帮助的,以便了解我们如何将其应用于日常SEO任务。

机器学习过程
下图显示了Muller在TechSEO Boost上分享的机器学习过程:

重要的是要记住,一些培训数据应保留在过程的后期进行测试。

在可能的情况下,还应清楚地标记此数据,以帮助机器学习算法识别噪声数据集内的分类和类别。

正是由于这个原因,Google要求我们标记图像以验证我们的身份:

这证明了我们人类在杂乱的环境中挑选对象的能力,但它还为Google提供了更高质量的图像数据。

上周刚刚公布了无监督机器学习方法的缺陷,以及可以解释的训练数据集。

Gmail中的“智能撰写”功能通过在预测用户可能想说的内容时更喜欢某些代词来证明性别偏见。

据路透社报道,“Gmail产品经理保罗兰伯特说,公司研究科学家在1月份发现了这个问题,当时他打字”我下周会见投资者“,Smart Compose提出了一个可能的后续问题:”你想要吗?遇见他?“而不是”她。“

这里的挑战不仅限于如此规模的项目。想要弄脏手的营销人员必须意识到机器学习的局限性以及令人兴奋的可能性。

Muller补充说,人们倾向于过度填充他们的数据,这降低了他们使用的模型的准确性和灵活性。当模型与一个特定数据集非常接近时,会发生这种(非常常见的)现象,从而降低其对新方案的适用性。

有效扩展的能力使机器学习具有吸引力,因此过度拟合是需要小心避免的。有一个很好的引到这个话题在这里,它也是通过这个形象很好的解释:

那么,如何使用这个AI子集来提高SEO性能呢?

如何使用机器学习SEO
与所有炒作友好型技术一样,企业也热衷于参与机器学习。然而,关键是不要因为害怕被遗忘而“使用机器学习”,而是为每个企业找到机器学习的最佳用途。

布兰妮·穆勒(Britney Muller)在TechSEO Boost的会议期间分享了她在Moz的角色。

第一种是使用Algorithmia高级内容摘要生成器自动生成元描述的方法,然后将其与Google直接从登录页面提取的自动描述方法进行比较。

在尝试鼓励积极的点击率时,元描述仍然是一项重要的资产,但是花费了大量时间来制作这些片段。可以解释登录页面含义并创建可点击摘要以在SERP中显示的自动替代方案将非常有用。

Muller分享了一些例子,比如上面的图片,以展示两种方法之间的比较。机器学习方法并不完美,可能需要进行一些调整,但与谷歌的选择相比,它可以很好地传达页面的意图。

Moz的团队已将其构建到Google表格中:

自动图像优化
SEO的机器学习的另一个有趣的用途是图像优化的自动化。布兰妮·穆勒(Britney Muller)展示了如何在20分钟内训练出一种区分猫和鸭的算法,然后将这个模型用于一个高精度的新数据集。

对于大型零售商而言,这种方法的应用可能非常有益。由于每天都有大量新图像添加到库存中,并且随着视觉搜索的增加,可扩展的图像标签系统将证明是非常有利可图的。如TechSEO Boost所示,对于愿意建立自己的模型的企业来说,这是一个非常现实的可能性。

布兰妮穆勒描述的机器学习的进一步用途是播客的转录。这种任务的自动化方法可以将音频文件转换为搜索引擎更易读的内容,从而有助于对相关主题进行索引和排名。

Muller详细介绍了通过Amazon Web Services使用Amazon Transcribe产品实现此目标的方法。

音频被分解并在J-SON文件中以很多细节传送,播客上的不同扬声器分别标记。

在会议中没有足够的时间来研究SEO的机器学习的每一个潜在用途,但Muller的核心信息是业内的每个人都应该努力至少掌握这些概念的工作知识。

我们可以看到,在处理大型数据集来识别模式时,机器学习确实很出色。

工具和资源
订婚的最佳方式是将理论与实践相结合。这几乎总是如此,但它与编程有关,是一个特别有效的建议。

Muller's并不是全天引用Google Codelabs的第一次或最后一次谈话。

比以往任何时候都有更多的资源,像亚马逊和谷歌这样的人希望机器学习变得平易近人。亚马逊推出了机器学习课程,Google的速成课程是学习成功项目组件的绝佳方式

一旦获得基本的掌握,谷歌拥有的Kaggle一直是审判新数据集和审查世界各地数据科学家所做的创新工作的好地方。

此外,Google的Colaboratory使您可以轻松开始项目并与远程团队合作。

关键要点:SEO的机器学习
通过Muller的演讲特别清楚的是,SEO的机器学习应用程序是多么平易近人。此外,对于愿意在该学科中投入一些时间的人来说,实验的空间是前所未有的。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK