Return to site

揭开SEO的秘密:Google如何解释搜索查询

· seo优化

几乎每个搜索词都是一个隐含或明确的问题。对于语音搜索和移动设备,谷歌更重要的是能够识别搜索查询及其背后的用户意图或含义。这有助于搜索引擎提供精确匹配用户的搜索结果。请求。在我们最新的揭开SEO的秘密,客座专家Olafkopp是Aufgesang入站营销有限公司的联合创始人、SEO主管兼首席业务开发官(CBDO),他负责研究谷歌的语义和机器学习。

这都是什么意思?

2009年,谷歌搜索质量小组的技术负责人Ori Allon在采访IDG:

“我们正在努力提高搜索质量,以便更好地理解查询的上下文,以及查询的内容。查询不是所有术语的总和。查询有其背后的意义。对于像“布兰妮·斯皮尔斯”和“巴拉克·奥巴马”这样的简单查询,我们很容易对页面进行排名。但当问题是“我做完眼科手术后该吃什么药?”时,这就难多了。我们需要理解…的含义“

最终,谷歌想要识别用户或搜索的意图。

谷歌如何识别搜索意图

要做到这一点,谷歌必须了解上下文。在谈到上下文时,我们必须区分搜索查询上下文(如术语之间的关系)、用户上下文(如位置)和(搜索)历史上下文和主题上下文。有些形式的上下文是动态的,可以随着时间的推移而改变。通过考虑所有可用的上下文形式,可以为每个搜索查询推断出对用户意图的单独和扎实的理解。

因此,谷歌必须回答以下问题:

  1. 用户在哪里?
  2. 用户使用哪个设备进行搜索?
  3. 用户对过去感兴趣的是什么?
  4. 这些术语是如何相互关联的?
  5. 搜索请求中包括哪些实体?
  6. 在什么主题下使用术语?
  • Google可以快速回答前两个问题使用客户端信息,GPS数据和IP地址。第三个问题可以使用搜索历史、点击SERP和一般的在线行为来回答。
  • 这,这个,那,那个最后三个问题,它与搜索查询的实际意义有关,无法很容易地回答。
进入RankBrain

谷歌推出RankBrain是朝着改进规模和性能迈出的一大步。

为了使Google能够识别搜索词的含义,必须使用统计方法来模拟一种语义理解。这就需要使用注释或注释对搜索词进行分类,并对相关主题尚不清楚的术语进行映射。由于每天输入谷歌的搜索词数量巨大,这不可能是手动进行的。要实现可伸缩性,必须使用集群分析和自动聚类。

自2015年谷歌推出RankBrain形式的机器学习(MachineLearning)以来,谷歌就一直能够做到这一点。这帮助Google将可伸缩性和搜索查询的重建语义理解之间的点连接起来。

解释搜索查询的方法

谷歌使用所谓的向量空间分析来解释搜索查询。它们将搜索查询转换为向量,并在向量空间中绘制与其他术语的关系。通过比较关系模式,即使以前没有对特定的搜索查询进行分析,也可以识别搜索的意图或意义。

在这方面,用户信号就像个人的点击率一样。搜索结果似乎扮演着特别重要的角色。在谷歌员工参与的两个科学项目中,我发现了一个解决这个问题的算法如何工作的有趣信息。

在……里面基于属性参数化的个人搜索中用户交互的学习,解释了google如何能够使用对用户行为和单个文档的分析,在搜索查询和单击的文档之间创建语义属性关系,甚至支持自学习。排名算法:

他说:“私人搜查的情况则不同。用户通常不共享文档(例如电子邮件或个人文件),因此直接在用户之间聚合交互历史变得不可行。为了解决这个问题,我们选择使用语义上一致的属性来表示文档和查询,而不是像在Web搜索中那样直接从用户行为中学习给定的[Query,doc]对,这些属性在某种程度上表示了文档和查询的内容。

这种方法如图2所示。文档和查询都投影到聚合属性空间中,匹配是通过该中间表示完成的,而不是直接进行的。由于我们假设属性在语义上是有意义的,我们期望类似的个人文档和查询能够共享许多相同的聚合属性,从而使属性级别匹配到学习级别模型中的有用特性。“

在本文档中,给出了两种Google用于建立搜索查询内容的方法。所谓的“提升分数”在第一个题为“单词共现聚类”中起着核心作用:

在这个公式中,“wi”表示与单词词根密切相关的所有术语,如拼写错误、复数、单数和同义词。“a”可以是任何用户交互,比如搜索特定的搜索词或访问特定的页面。例如,如果电梯得分为5,那么搜索“wi”的概率是搜索“wi”的一般可能性的5倍。

“高分可以帮助我们围绕有意义的词汇而不是无趣的词汇来构建主题。在实践中,在最近的时间窗口内,可以使用Google搜索历史中的单词频率来估计概率。“

这样就有可能将术语分配给某些实体,如“奔驰”和(或)-如果有人在寻找替换的汽车零部件-使用主题上下文集群“CAR”。然后,上下文集群或实体也可以分配给它的术语通常是与搜索项同时出现的。这使得快速创建特定主题的搜索词WordCloud成为可能。升力分数的大小决定了与主题的密切程度:

“我们使用Lift评分来根据重要性对单词进行排序,然后对其进行阈值化,以获得一组与上下文高度相关的单词。”

当“wi”已知时,这种方法特别有用,例如搜索已知的品牌或类别。如果“wi”不能被明确定义,因为同一主题的搜索条件太过多样,那么Google可以使用第二种方法:加权传记聚类。

这种方法基于两个假设:

  1. 具有相同意图的用户使用不同的搜索查询。搜索引擎仍然显示相同的搜索结果。
  2. 对于任何给定的搜索查询,在顶部搜索结果中都会显示类似的URL。

应用这种方法,将搜索词与顶级URL进行比较,并创建查询-URL对,其关系也根据用户的点击率和页面印象进行加权。这使得能够识别不包含相同词法根的搜索词之间的相似之处,从而创建语义集群。

实体在解释搜索查询中的作用

谷歌想找出一个问题所指的实体是什么。通过查看搜索术语中的实体和实体之间的关系上下文,Google可以识别所寻求的实体。

即使结果略有不同,谷歌也认识到,“比尔·鲍曼”(BillBowerman)和“菲尔·奈特”(PhilKnight)这两个实体正在被搜索,尽管搜索查询中没有出现这些实体的名字。不管我问的是一个含蓄的问题,比如“创始人耐克”,还是一个明确的问题,都没有区别。实体,“耐克”,和关系背景,“创始人”,是足够的。

这种能力常常被错误地归因于RankBrain和/或Google的机器学习技术。然而,它实际上起源于蜂鸟,以及知识图。因此:谷歌在RankBrain出现之前就已经做到了这一点。

早在2009年,谷歌就引入了第一种语义技术来解释搜索词,其“相关搜索”。这项技术的发明者Ori Allon已经为谷歌的用户做好了准备,使其对潜在技术的排名产生了更广泛的影响。可以找到Allon公司开发的技术的专利。这里.

该专利主要涉及搜索查询的解释及其微调。这意味着RankBrain以后可能会以其机器技术为基础。自从RankBrain(如果不是更早的话),Google就能够使用机器学习(MachineLearning)对搜索查询进行可伸缩的语义解释。

根据专利,对搜索查询的微调涉及特定的实体,这些实体经常出现在为原始搜索查询或同义词排序的文档中。

RankBrain之前的问题是找出实体并将它们存储在知识图中时缺乏可伸缩性。知识图主要基于维基数据中的信息,维基百科实体对此进行了验证,这意味着它是一个手工策划的、因此是静态的、不可扩展的系统。

“维基百科经常被用作实体映射系统的基准。正如第3.5小节所述,这将产生足够好的结果,我们认为,如果在这方面进一步努力会带来合理的收益,那将是令人惊讶的。“

谷歌变得很好(还是很棒?)

可以有把握地假定,谷歌一直在致力于开发搜索引擎这包括至少自2007年以来,为了更好地理解搜索、查询和文档的含义而产生的语义影响。

到今天为止,使用像知识图和机器学习这样的语义结构,谷歌似乎非常接近前副总裁玛丽莎·梅(Marissa May)提出的目标-摆脱纯粹的关键词-基于概念的搜索引擎或基于上下文的搜索引擎。

“现在,谷歌在关键词方面真的很好,这是一个限制,我们认为搜索引擎应该能够克服时间的限制。”人们应该能够提出问题,我们应该理解他们的意思,或者他们应该能够在概念层面上谈论事情。我们看到了很多基于概念的问题-不是关于页面上会出现什么词,而是更像是“这是关于什么的?”

而且,真的,现在是谷歌实现这一目标的时候了-如果你认为语音搜索正在全球范围内进行,而搜索查询变得越来越复杂的话。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly