Return to site

揭开SEO的秘密:这都是谷歌搜索的语义

· seo优化

“知识图”、“蜂鸟”和“RankBrain”等里程碑帮助谷歌朝着完善的搜索引擎迈进了几步。统计学、语义理论和结构以及机器学习都起着重要的作用。在最近揭开SEO的秘密,客座作者OlafKopp研究了谷歌搜索中语义和机器学习的各个方面。

在最后一篇文章中揭开SEO的秘密,我概述了我对Google如何解释搜索查询以及他们背后的用户意图。现在是时候看看多么,怎样谷歌在提高搜索准确性方面做得很好。

语义搜索还是统计信息检索?

我和SEO的同事JensFauldrath就谷歌是否真的是一个语义搜索引擎进行了激烈的争论(文明的辩论?)。

谷歌向用户展示的结果无疑让它看起来像是搜索引擎巨头对搜索查询和文档有了高度发展的语义理解。然而,导致这一现象的大部分原因是基于统计方法,而不是任何真正的语义理解。但是由于语义结构,结合统计和机器学习,Google现在能够接近语义理解。

例如,我们发现可以从搜索查询和相应结果的统计数据中自动学习有用的语义关系,也可以从基于Web的文本模式和格式化表的累积证据中自动学习语义关系,这两种情况下都不需要任何人工注释的数据。

Word2vec是如何工作的

为了更清楚地说明这一点,我将简要介绍统计文本分析的工作。Google使用向量空间分析来评估相关性和识别关系。向量空间由可以通过向量空间中的向量连接的单个数据点组成。向量之间的角度告诉我们数据点之间的相似和/或关系。角度越大,相似性越小。角度越小,相似性越大。例如,为了分析主要组件,从搜索查询和所有可用的相关文档在向量空间中创建了一个向量。对于这个所谓的“单词嵌入”过程,谷歌使用word2vec。

使用数据点之间的邻近性可以显示它们之间的语义关系。通常,向量是为搜索查询和可以放置在彼此之间的文档而创建的。另一种用法是从文档及其内的术语中创建向量,以标识其概念或主题。还可以从人、品牌、公司或主题等实体中形成矢量。

为了利用向量空间分析,首先需要对文档进行索引,并将其映射到构成相关主题语料库的概念或主题区域。执行这一步骤的过程是潜在语义索引(LSI),它使创建向量空间成为可能,从而在精确性和回忆性方面提供最佳的结果。使用这种方法,还可以对与主题相关的术语进行语义分类或聚类。

如何自动分类搜索查询

过去,主要的问题是缺乏可伸缩性,因为搜索查询必须手动分类。这是谷歌前副总裁玛丽莎·梅耶尔2009年接受采访时就这一主题发表的讲话:

“当人们谈论语义搜索和语义Web时,他们通常指的是非常手工的东西,有各种词与事物之间各种关联的地图。”我们认为,通过模式匹配数据,建立大规模的系统,你可以得到更好的理解。大脑就是这样运作的。这就是为什么你有这些模糊的连接,因为大脑一直在处理大量的数据,一直是…。问题是语言发生了变化。网页变化。人们表达自己的方式发生了变化。所有这些都关系到语义搜索应用的好坏。这就是为什么最好有一种基于机器学习的方法,并对数据进行更改、迭代和响应。这是一种更有力的方法。这并不是说语义搜索在搜索中没有作用。只是对我们来说,我们更喜欢把注意力集中在能够扩大规模的事情上。如果我们能想出一个可以扩展的语义搜索解决方案,我们会非常兴奋的。目前,我们看到的是,我们的许多方法近似于语义搜索的智能,但通过其他方法实现。

当我们谈到Google识别搜索、查询或文档的意义时,我们所称的语义理解大部分是建立在统计方法上的,比如向量空间分析或TF-ID之类的统计文本分析方法。因此,严格来说,这并不是基于真正的语义学。但结果确实非常接近语义理解。机器学习应用的增加-以及更详细的分析-使得搜索查询和文档的语义解释更加容易。

语义理解是谷歌的目标之一

Google最重要的目标之一是实现对搜索词和索引文档的语义理解,以便显示更多的相关性搜索结果。当(搜索)查询及其包含的术语可以明确地理解时,就存在语义理解。明确的解释往往会因疑问而变得困难,包括具有多种含义的术语、系统所不清楚的术语、不明确的措辞、个人的理解等。

为了帮助理解,分析所使用的单词,他们的顺序,以及他们的主题的背景,时间和地点。机器学习和/或RankBrain使Google能够使用集群分析自动创建新类并将搜索查询分配给它们。这不仅建立了一个高度的细节,而且还创造了可伸缩性和提高性能。为向量空间分析建立新的向量空间也是可能的。

通过这种方式,统计与机器学习相结合,提供了越来越接近于对搜索查询和文档的语义理解的语义解释。Google希望能够借助统计方法和机器学习重新创建真正的语义搜索。此外,现代谷歌的核心元素搜索引擎知识图,也是基于语义结构的。

在这个关于Google语义和机器学习的系列文章的第三部分中,OlafKopp将查看语义的基础:图,实体和本体论。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly