Return to site

谷歌seo-PageRank已经更新

谷歌seo

· seo优化

PageRank由Continuation Patent更新

由加利福尼亚州山景城的谷歌公司开发的流行搜索引擎使用PageRank.RTM。作为页面质量指标,有效地指导网络爬行,索引选择和网页排名的过程。一般来说,PageRank技术会为其在网络上遇到的每个网页计算并分配PageRank分数,其中PageRank分数用作衡量给定网页相对于其他网页的相对质量。PageRank通常可确保重要和高质量的网页获得高PageRank分数,从而使搜索引擎可以根据其相关的PageRank分数有效地对搜索结果进行排名。

显示PageRank更新的延续专利今天获得批准。原始专利于2006年提交,并提醒我很多雅虎的TrustRank(该专利的申请人引用了该专利的新版本基于的大量文件之一)。

声称是:

1.一种用于产生网页上的页面的排名的方法,包括:接收多个网页,其中所述多个网页与页面链接相互链接; 接收n个种子页面,每个种子页面包括到所述多个网页中的相应网页的至少一个外出链接,其中n是大于1的整数; 通过一台或多台计算机为每个页面链接和每个输出链接分配相应的长度; 由所述一个或多个计算机并从所述n个种子页面中根据所述链接的长度来向所述多个网页中的第一网页识别第k个最接近的种子页面,其中k大于1且小于N; 根据从第k个最接近的种子页面到第一网页的最短距离确定第一网页的排名分数;

这个延续专利的新版本的第一个要求是:

声称是:

1.一种方法,包括:获得标识要排序的一组页面的数据,其中所述一组页面中的每个页面通过页面链接连接到所述一组页面中的至少一个其他页面; 获得标识一组n个种子页面的数据,每个n种子页面包括至少一个到该组页面中的页面的传出链接,其中n大于1; 访问分配给一个或多个页面链接和一个或多个输出链接的相应长度; 并且对于所述一组页面中的每个页面:根据各自的长度来识别对所述页面的第k个最接近的种子页面,其中k大于1且小于n,确定从第k个最接近的种子页面到页; 以及基于确定的最短距离确定页面的排名分数,

PageRank最新专利是:

利用网页链接图中的距离产生页面排名
发明人:Nissan Hajaj
受让人:Google LLC
美国专利:9,953,049
授予日期:2018年4月24日
提交日期:2015年10月19日

抽象

本发明的一个实施例提供了一种产生网页排名的系统。在操作期间,系统接收要排序的一组页面,其中该组页面与链接互连。系统还接收一组种子页面,其中包括到该组页面的外出链接。系统然后根据链接的属性和附加到链接的页面的属性为链接分配长度。系统接下来基于页面之间的链接的长度来计算从该组种子页面到页面集合中的每个页面的最短距离。接下来,系统基于计算出的最短距离确定该组页面中的每个页面的排名分数。然后系统根据该组页面的排名分数产生该组页面的排名。

在这个较新版本的PageRank中,我们看到它如何通过将信任构建成如下的链接图来避免操纵:

PageRank可能会降低这些技术效果的一种可能的变体是选择一些“可信”页面(也称为种子页面),并通过遵循来自可信页面的链接发现其他可能很好的页面。例如,该技术可以使用一组高质量的种子页面(s.sub.1,s.sub.2,... s.sub.n),并为每个种子页面i = 1,2,...。。。,n,系统可以使用以下公式迭代计算网页P集合的PageRank分数:

.A-inverted ..noteq ..di-elect cons ..功能..times ..fwdarw ..times ..功能..times ..功能..fwdarw。其中Ri(si)= 1,并且w(q.fwdww.p)是给链接q.fwdarw.p的可选权重,基于它的性质默认权重为1)。

通常,希望使用大量种子页面来容纳快速增长的网页内容中包含的不同语言和广泛的字段。不幸的是,PageRank的这种变化需要分别为每个种子解决整个系统。因此,随着种子页数的增加,计算的复杂度线性增加,从而限制了可以实际使用的种子的数量。

因此,需要一种用于使用大量多样化的种子页面来产生网页上的页面的排名而不存在上述技术的问题的方法和设备。

专利总结如下描述:

本发明的一个实施例提供了一种根据页面之间的距离对网页进行排名的系统,其中页面与链接互连以形成链接图。更具体地说,选择一组高质量种子页面作为用于对链接图中的页面进行排序的参考,并且计算从该组种子页面到链接图中的每个给定页面的最短距离。每个最短距离是通过对从种子页面到给定页面的最短路径之后的一组链接的长度求和而获得的,其中给定链接的长度基于链接的性质和连接到链接的页面。计算出的最短距离然后用于确定关联页面的排名分数。

该专利讨论种子网站覆盖的各种主题的重要性,以及一大批种子网站的价值。它也给了我们一个爬行和排名的搜索总结,如下所示:

爬网排名和搜索过程

图。图3示出了根据本发明实施例的爬行,排序和搜索过程。在爬网过程中,网络爬行器304爬取或以其他方式搜索网络302上的网站以选择要在数据中心308中以索引形式存储的网页。具体地,网络爬取器304可以通过使用网页排名分数来优先考虑爬取过程。然后,在存储在数据中心308中之前,所选择的网页在305(使用上述的排名过程)中被压缩,索引和排列。

在随后的搜索过程中,搜索引擎312通过网络浏览器314从用户311接收查询313.该查询313指定了要在该组文档中搜索的多个词语。响应于查询313,搜索引擎312使用排名信息来识别满足该查询的高度排序的文档。搜索引擎312然后通过网络浏览器314返回响应315,其中响应315包含匹配页面以及排名信息和对所识别文档的引用。

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly