Return to site

在SearchLove采访Google的John Mueller:域权限指标,子域与子文件夹等

· seo优化

我之前曾写过和谈过如何解释谷歌的官方声明,技术文档,工程师的写作,专利申请,收购等等(参见:从马口和相关视频以及“海豚吃什么?”等帖子? “)。当我有机会在我们的SearchLove伦敦2018年会议上采访谷歌的约翰·穆勒时,我知道会有很多事情他无法透露,但有几个关键领域,我认为我们看到了不必要的混淆而且我认为我可以让约翰放弃一些亮光。[DistilledU订阅者可以在这里查看其余会谈的视频 - 我们仍在努力允许与约翰分享采访]。

穆勒是谷歌的网站管理员趋势分析师,现在他是谷歌最明显的发言人之一。他特别是技术搜索信息的主要来源,并且是谷歌中为数不多的人物之一,他们将回答关于(某些!)排名因素,算法更新和爬行/索引过程的问题。

内容
新信息和官方确认
确认:Google拥有域级权限指标
确认:Google确实有时会以不同方式处理子域名
更多地了解网站管理员关系的结构
讨论中更有趣的引用
算法更改不会轻易映射到您可以执行的操作
Google员工了解机器学习排名因素吗?
为什么结果计数太错了?
有关域权限问题的更多详细信息
也许把你的nfsw和sfw内容放在不同的子域上
约翰可以“有点看到[等级跟踪]有意义的地方”
我们走了很长的路
在舞台上进行面试的个人经验教训
约翰没有说的事情
新信息和官方确认
在下面的帖子中,我已经说明了约翰和我所拥有的一些交流,我认为这些交换显示了新的和有趣的信息,或者我们之前曾经怀疑的确认的事情,但在记录之前从未见过证实。

不过,我想我会开始概述我认为最重要的细节:

确认:Google拥有域级权限指标
我们之前曾见过很多场合,谷歌发言人曾谈到像Moz的域名管理局(DA)这样的指标是Google没有用作排名因素的专有外部指标(这是对许多博客文章以及其他混淆Moz DA指标的文章的回应)用一种衡量某种域名权威的一般概念)。我觉得有机会获得一些清晰度。

“当人们问Google时,我们已经看过几次:”你使用域名权限吗?“这是一个简单的问题。你可以简单地说:”不,这是一个专有的Moz指标。我们不使用Domain Authority。“但是,你有一个像LIKE域权威的概念吗?”

我们有一些来回,最后穆勒确认了以下内容(参见下面的相关部分):

Google确实拥有“映射到类似内容”的域级指标
添加到现有域的新内容最初将从该域继承某些指标
它不是纯粹的基于链接的指标,而是试图捕捉一般的信任感
阅读更多信息

确认:Google确实有时会以不同方式处理子域名
我希望几乎所有业内人士都看到网站管理员和Google员工之间在子域名和子文件夹问题上至少有一些长期的反复(例如,请参阅Google的YouTube视频和此讨论它)。我真的想深究这一点,因为对我而言,它代表了一个相对明确的例子,谷歌说的东西与真实世界的实验所显示的不同。

我决定通过这个角度来设置它:通过承认我们完全可以相信Google没有一个算法“切换”将事物分类为子域并将它们故意降低,但我们经常看到现实世界的案例研究显示了移动的提升,因此要求约翰思考为什么我们可能会看到这种情况发生。他说[强调我的]:

一般来说,我们......在考虑网站概念的地方,我们试图找出属于这个网站的内容,有时可能包括子域,有时候不包括子域。

有时包括子目录,有时不包括特定的子目录。所以,这可能就是在那个特定情况下我们说的那样,“好吧,对于这个网站,它不包括那个子域,因为看起来这个子域实际上是独立的。所以,如果你把它们折叠起来然后它最终可能是一个不同的模型,而对于很多其他网站,我们可能会说,“嗯,这里有很多子域,因此所有这些子域都属于主要网站,也许我们应该把它们视为同一件事。“

在这种情况下,如果你在该网站内移动东西,主要是从子域到子目录,你就不会看到很多变化。所以,这可能是很多这些差异的来源。从长远来看,如果你有一个我们认为是你网站的一部分的子域,那么这与子目录是一样的。

换句话说,谷歌的官方路线是:

Google有一个“网站”的概念(请参阅上面关于域级指标的讨论)
在某些情况下,子域(甚至子文件夹)可以被视为不是站点其余部分的一部分
如果我们正在查看Google认为不属于网站其余部分的子域,那么网站管理员可能会通过将内容移动到子文件夹(被视为网站的一部分)来提升性能
不幸的是,我无法让John知道如何提前告诉您的子域是否被视为主站点的一部分。因此,我的建议仍然与以前一样:

通常,在子文件夹而不是子域中创建新的内容区域,并考虑将子域移动到具有适当重定向等的子文件夹中。

改变的是,我认为我现在可以说这符合谷歌的官方观点,而它曾经与他们的官方路线不一致。

更多地了解网站管理员关系的结构
我个人对进入对话感兴趣的另一个方面是John的角色如何适应更广泛的Google团队,他如何与同事合作,以及当我们直接从他们那里学习新事物时幕后发生的事情。虽然我不觉得我们从这一系列的提问中获得了重大启示,但它仍然很有趣:

我认为在一年之后,它会好起来,我们已经回答了你所有的问题。这就像我们完成了。但是总会有新的东西出现,而且很多我们会去工程团队讨论这些问题。有时我们会与新闻团队一起讨论,如果周围有任何敏感,如何构建它,在那里谈论什么样的事情。

例如,我很想知道,当我们问一个问题时,约翰还不知道他自己检查源代码的答案,转向工程师等。结果:

他通常不会参加搜索质量会议(时区!),也不会直接查看源代码
他确实求助于团队周围的工程师找到可以回答他的问题的专家,但没有工程师致力于网站管理员关系
出于可以理解的原因,工程师普遍不愿意将自己的头脑放在栏杆上,并公开谈论事物在世界上的运作方式。我们确实潜入了一个特别令人困惑的地方,结果是有启发性的 - 我向John指出,我们希望能够更直接地接触工程师来回答这些边缘情况:

具体示例:noindex页面变为nofollow的情况
在去年的后端,约翰惊讶我们一个说法说是NOINDEX意志页,从长远来看,最终也视为nofollow的。

虽然这在许多方面都是一个小细节,但我们中的许多人都认为这暴露了我们心理模型中的空白。我当然觉得“noindex,follow”指令的存在意味着有一种方法可以从索引中排除页面,但链接图中包含了它们的链接。

我发现比启示本身更有趣的是它揭示了Google内部的思维过程。它归结为那个知道这是如何工作的人 - 建造它的工程师 - 有诅咒的知识。他们知道从索引中永久删除的页面无法继续在链接图中显示其链接,但他们从未想过告诉John(或外部世界),因为他们从未想过那些在外面的人还没有意识到它是这样工作的[强调我的]:

很长一段时间以来都是这样的,而且我不知道,在过去的一两年里,我们基本上去了团队,并且说:“这真的没有意义。当人们说没有索引时,我们最终将它从我们的索引中删除,然后如果它从我们的索引中删除,那就是规范的,所以这些链接已经消失了。我们是否曾推荐过一段时间没有任何意义的东西?“ 他们就像,“是的,当然。”

讨论中更有趣的引用
我们的对话涵盖了很多主题,所以我在这里列出了一些其他有趣的片段:

算法更改不会轻易映射到您可以执行的操作
为了表现更好,Google员工不一定知道你需要做些什么,特别是在算法更新的情况下,他们对“搜索结果现在比以前更好”的想法不能轻易转化为“在这次更新中失去了知名度可以从这里做XYZ改进“。我对这种情况的解读是,SEO工作对于解决算法变更和长期运行方向性主题的工作有持续的价值,以指导网站管理员的路线图:

[我们不一定会认为这样做]“网站管理员这样做是错误的,他们应该这样做”,但从某种意义上来说更多“好吧,总的来说这个搜索结果看起来并不那么棒,所以我们必须做出一些改变。“然后有点接受,好吧,我们改进了这些搜索结果,然后说,”这就像你作为网站管理员应该关注的那样“,这真的很难。

Google员工了解机器学习排名因素吗?
我推测,搜索排名的可解释性有一个长期趋势,这将影响搜索工程师以及我们这些外部人员。我们至少得到了John的清晰度,目前他们主要使用ML来创建排序因子,这些因素可以用于更传统的排名算法,并且他们可以调试和分离部分(而不是ML生成的SERP,这将是很多不太可检查):

[并非]我们只有一个机器学习模型,就像哦,有这个谷歌机器人抓取一切,并出来了一堆搜索结果,没有人知道之间发生了什么。这就像所有这些小步骤正在发生,其中一些使用机器学习。

是的,他们确实有秘密的内部调试工具,显然,约翰描述为:

有点像搜索控制台但更好

为什么结果计数太错了?
我们在结果计数上有一些来回反复。我知道谷歌告诉我们他们并不准确,只是近似值。所以是的,当然,但是当你有时得到一个网站:查询声称13米的结果时,你点击第2页并发现实际只有11个 - 而不是11米,实际上只有11个,你对自己说这不是特别有用的近似。我们之前没有比我们之前听过的官方路线更进一步,但如果您需要再次确认:

我们的系统中有各种计数器,试图弄清楚我们对这些事情有多少结果,当重复内容出现,或者我们抓取一个网站并且它有大量重复内容时,这些计数器可能会真的很高涨。

但实际上,在索引和后期阶段,我会说,“好吧,实际上大多数这些URL都和我们已经知道的一样,所以无论如何我们都可以删除它们。”

...

因此,在[site:queries]中搜索结果中会发生大量过滤,您可以看到更多信息。这有点帮助,但是那里你并没有真正的计数。我认为,你仍然可以将它作为一种粗略的衡量标准。它就像有很多,它是一个大网站?它最终会遇到大量基本上全部被淘汰的URL吗?你可以在那里看到一点点。但是你真的没有办法获得确切的URL数量。

在我上面提到的域权限问题上(不是Moz Domain Authority专有度量,而是域级权限度量的一般概念),这是John所说的其余部分:

我不知道我是否称之为权威,但我们确实有一些指标更多地位于网站级别,某些指标更多地位于网页级别,而某些网站级别指标可能类似于映射成类似的东西。

...

我经常看到的主要是你在网站上放了一个全新的页面。如果它是一个我们知道的质量较低的未知网站或网站,那么我们可能不会快速提取它,而如果它是一个非常知名的网站,我们将能够信任该内容在那里,我们可以相当快地选择它,并且排名更好一点。

...

它不是基于链接本身,而是基于这个一般的想法,我们知道这个网站通常都很好,因此如果我们在这个网站上发现一些未知的东西,那么我们可以给它一点点价值也是如此。

...

至少在我们更了解这个新事物实际上具有这些特定属性之前我们可以更专注地关注它们。

也许把你的nsfw和sfw内容放在不同的子域上
我在上面谈到了我们在子域与子文件夹问题上得到的新清晰度,John解释了一些关于安全搜索的“这是一个站点与否”。如果您运行的工作/成人内容不安全且可能会从安全搜索中过滤掉并且您希望在常规搜索结果中显示其他内容,则可以考虑将其拆分 - 可能是在不同的子域中 - 谷歌可以考虑将它们视为单独的网站:

我们可以更清楚地分离网站的不同部分并以不同的方式对待它们,我认为这对我们有所帮助。因此,一个非常普遍的情况也是安全搜索,成人内容类型的情况,你可能从一个网站开始,有一个混合不同类型的内容,对我们来说,从安全的搜索角度来看,我们可能会说,“好吧,整个网站应该通过安全搜索进行过滤。”

然而,如果你把它分开,并且你做了一个更清晰的部分,这实际上是成人内容,这是一般的内容,那么我们的算法更容易说:“好的,我们将专注于此安全搜索的一部分,其余的只是一般的网络搜索。“

约翰可以“有点看到[等级跟踪]有意义的地方”
我想看看我是否可以让约翰承认为什么营销人员和网站管理员可能想要或需要排名跟踪 - 我的论点是,这是获得某种竞争洞察力的唯一途径(因为你只获得了自己域名的搜索控制台)和此外,它是了解算法更新对您自己的网站和竞争格局的影响的唯一方法。

我努力克服那种说谷歌不希望你这样做的行,它违背了他们的条款,有些人做了不好的事情来隐藏他们的活动。我在下面有一个小节,但约翰确实说:

从竞争分析的角度来看,我有点看到它有意义的地方

但是在推荐工具时,ToS的问题会引起他的问题:

我们如何确保我们推荐的工具不会突然开始违反我们的服务条款?当我们不知道接下来会做什么时,我们怎么能推广任何工具呢?

我们走了很长的路
很高兴最后向业内人士努力工作,以及为我们的会议提供一个很好的小插件[显然是强调我的]:

我认为总的来说,我觉得搜索引擎优化行业已经走了很长一段路,我不知道,五年,十年,因为对实际技术问题的关注越来越多,那里有很多理解网站如何运作,搜索如何运作,我认为这是一个很棒的方向。所以,我之前提到过的巫术魔法,我认为随着时间的推移,这种魔​​法已经大大减少了。

而且我认为这部分的所有正在运行的,喜欢这里的这些会议。部分原因还在于,有很多非常棒的SEO在那里做了很棒的东西。

在舞台上进行面试的个人经验教训
以上所有内容都与我们学习或确认的有关搜索的内容或Google的工作原理有关。我还学到了一些关于进行面试是什么样的事情,特别是在很多人面前在舞台上这样做的事情。

我的意思是,首先,我了解到我喜欢它,所以我希望将来可以做更多这类事情。特别是,我发现它比主持小组更有趣。根据我的个人经验,主持一个小组(我过去做过很多)需要大量精力来确保人们在适当的时间内说话,你要将它们转移到下一个主题在适当的时候,每个人都会说出他们的作品,你会得到真正有趣的内容等。在1:1的采访中,这很简单:你希望主题尽可能地说话,你可以专注于一个这个人的话,以及他们对你的观众是否足够有趣。

在我的准备工作中,我努力思考如何确保我的问题简短而开放,并且他们是自足的,足以让约翰和观众理解,让约翰很好地回答他们。我认为我做得很合理但绝对可以继续练习以缩短我的问题。看着成绩单,我做了太多的谈话。话虽如此,我的准备工作很有价值。值得理解约翰的背景和历史,收集我的想法,并向他提供有关我的主要提问线的足够信息,使他能够寻找他可能没有触手可及的信息。我想我的平衡大致正确; 使他能够准备合理的金额,同时保留当天的几个具体问题。

我还需要更敏捷,并提出更多的跟进和延续问题 - 这很难,因为你必须站起来思考 - 我认为我在那些我故意做好准备的领域做得相当好。这主要是在更有争议的领域,我知道约翰的初始路线可能是什么,但我也知道我最终想要摆脱它或深入研究。我发现我发现它更难以预料到我没有达到我想要的100%。令人惊讶地难以解析刚刚说过的所有内容并在运行中弄清楚它是否有趣,新颖和完整。

这一切都来自审讯者主席的舒适。被提问者比提问者更难,所以感谢约翰同意来,因为他的准备工作,以及作为一项好运动,因为我在他允许谈论的事情上戳了戳。

我还看到他的一个3D打印的Googlebot-in-a-skirt角色 - 与性别假设的良好平衡,这在技术领域过于常见:

约翰没有说的事情
有几个方面,我希望我能更快地想到我或者我不能比PR线更深的地方:

“有点像搜索控制台”
我不知道即使我推动我是否能够从他身上获得更多,但回头看谈话,我想我放弃了太快,并且给了约翰太多的“出局”当我询问他们的内部工具集时。他说它“有点像搜索控制台”,我说“但更好”,并在口中说出来。我应该深入挖掘并询问他们可以看到的有关我们在Search Console中看不到的网站的具体信息。

约翰可以“有点看到[等级跟踪]有意义的地方”
我在上面承诺要深入了解我们的排名跟踪讨论。我指出“有些情况下,这对我们来说很有价值,我们觉得。所以,是的,我们为自己的网站获取了搜索控制台数据,但是我们没有得到竞争对手的数据,而且它是不同的。它没有给我们提供SERP正在发生的全部广度,你可以从其他工具中获得。“

我们从客户那里得到的问题是,“我们觉得我们受到了更新X的影响,如果我们没有排名跟踪,那么我们很难回去调试它。” 所以我问约翰“在这种情况下,你对顾问或网站管理员的建议是什么?”

我觉得这有点棘手。我想如果它是你的网站,那么显然我会专注于搜索控制台数据,因为这是我们向正在搜索的人展示时实际使用的数据。因此,我认为在您自己的网站上使用外部排名跟踪可能导致误导性答案的一个方面。在你看得见的地方,我看到我对所有这些关键词的知名度大幅下降,然后你在Search Console中查看就好了,没有人在搜索这些关键词,谁在乎我是否为他们排名或不?

...

从我们的观点来看,所有这些外部工具真正棘手的部分是他们刮掉了我们的搜索结果,所以这违反了我们的服务条款,而且我注意到有一点我需要进一步挖掘更多的东西。这些工具以非常偷偷摸摸的方式做到这一点。

(是的,我在这一点上确实指出我们很乐意使用API​​)。

他们做的事情就像他们在手机上使用代理。这就像你下载一个应用程序,它是一个免费的手机应用程序,并在后台运行谷歌查询,并将结果发回给他们。所以,所有这些偷偷摸摸的东西,在我看来,它几乎像边缘恶意软件,他们试图拿走用户的计算机并对它们运行查询。

感觉像是某种东西,我真的很难支持它。那么,这两个方面,就像我们喜欢的那样,好吧,从竞争分析的角度来看,我看到它有意义的地方,但就像这些数据来自哪里真的有问题。

最终,约翰承认“也许有一些方法可以让[谷歌]给你更多关于我们认为发生的事情的信息”但我觉得我本可以更好地推动对这类竞争活动数据的需求,以及整个市场(特别是当有谷歌更新时)。也许不足为奇的是,我无法深入挖掘这里的官方路线,也不能期望获得有关全新竞争洞察数据的新产品更新,但我对Google的观点仍然有点不满意。当Google改变他们的算法和工具,让我们了解我们的网站出现的SERP是有价值的,谷歌在ToS上注意而不承认需要这些数据的方式时,我觉得这些工具可以汇总SERP中的变化。

谷歌内部的出版商真的有很强的支持者吗?
约翰承认在Google内部关于搜索质量的许多对话中都是网站管理员的声音,但他也声称工程团队也理解并关心发布者:

工程团队,并非盲目专注于正在进行搜索的Google用户。他们明白,这种与社区的互动总是如此。人们正在制作内容,将其置于网上,希望Google将其视为相关内容并将其发送给那里。这种循环需要到位,你不能只说“我们在这里改进搜索结果,我们并不真正关心创建内容的人”。这不起作用。这是工程团队真正关心的事情。

我本来希望对网站管理员不断变化的“交易”更加努力,因为我认为导致网站点击次数减少的一些创新从根本上改变了这一点。在早期,有一项隐含的协议,谷歌可以复制和缓存网站管理员的受版权保护的内容,以换取他们的流量,这是一个社会上的好交易。它甚至在法庭上进行了测试 [维基百科是我发现的最佳链接]。

当复制扩展到不需要搜索者点击时,该交易就会改变。通过谈论直接从SERP购买,John设法巧妙地回答了这个问题:

我们试图从搜索者的角度思考最终目标是什么。例如,如果您是电子商务网站,有人可以直接从搜索结果中购买商品,那么他们就会从您的网站上购买。您实际上不需要在页面上实际点击它们来实际转换。当我们认为产品与搜索结果中显示相关时,我们可以通过一种方式使人们可以在他们点击的哪一个上做出明智的选择,然后我认为这也是一个整体的胜利。对整个生态系统而言。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OK