Categories


Tags


PageRank的计算方法以及影响因素

Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础。

网页级别概述

Google对网页级别的描述

作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为"网页 A 投了网页 B 一票"。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。"重要"的网页所投出的票就会有更高的权重并且有助于提高其它网页的"重要性"。

重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。

PR值算法原理总体上基于下面2个前提:

1、一个网页被多次引用,则它可能是很重要的;

一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。

2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值。

影响PR值的因素

PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:

1、网站的导入链接质量:

根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:

◆ 加入搜索引擎分类目录与已经加入目录的网站交换链接

◆ 获得来自PR值不低于4并与你的主题相关或互补的网站的链接

◆ 你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)

◆ 与你交换链接的网站具有很少导出链接

◆ 与内容质量高的网站链接(PR值上升潜力大)

2、 导出链接数量:

根据PR计算原理,由于"一个网页的重要性被平均的传递到它所引用的网页",因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。

3、搜索引擎收录一个网站的页面数量

在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。

正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。

附:查询网站收录页面数量:在搜索引擎中输入:site:www.yoursite.com(如果输入:site:yoursite.com,则获得的是在yoursite.com域名下所有二级域名的网页数量)。

工具推荐:www.marketleap.com/siteindex 可获得网站在多个主流搜索引擎中的网页收录数

4、首页PR的高低

尽管对PR的界定是针对网页而不是网站,但由于每个网页都依托某一网站而存在,首页是推广的核心页面,所以网站首页PR高低对内页各PR也产生直接影响。一般而言,一个网站各页面的PR值呈现以下走向:首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR降低1-2个档次。更深层次可能就无法列入评级范围了。当然,如果一个深层内页有很多外部或内部链接,情况则另当别论。

5、文件类型

Google可以索引到的网页和文件类型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是网站比较重要的内容或文章。因此Google默认PDF格式文件的PR天生为3,高于一般HTML文件。

同理,Google给予XML、PS、Word、Power Point、Excel等类型页面的PR也比普通网页文件高。因此,对于网站比较有价值的内容,建议做成PDF格式。

6、PR值的更新

Google 每个月进行一次彻底的数据更新(Dance),更新后的网站排名和导入链接都会有某些变化,但其PR更新时间一般要延迟至dance后三个月左右,而且网站的PR值相对稳定,要上升或下降一级PR是很不容易的事情。

工具推荐:

查看PR值是否处于更新期间:www.seochat.com/seo-tools/future-pagerank (如果结果出现不一致的情况,则处于更新期间)

PR值的作用

由于网页级别的高低直接受链接的影响,而链接仅是SEO的一个方面,因此PR的高低只能反映出SEO的部分效果。一个网页如果拥有高PR值能够说明的仅是:

◆ 网页比较重要,拥有了排名靠前的优先权,并不能与排名靠前直接划上等号

◆ 具有了获得高质量导入链接的谈判优势 搜索引擎会加快对网页数据的更新

◆ 看上去挺美

正因为具有了排名靠前的优先权和谈判优势,使得高PR网站往往最终确实产生高排名,业内不少人士就干脆直接将PR与SEO划等号,这不仅不正确,也不利于SEO实施。因为PR值不高的网站同样有可能获得好的排名,而PR高的不见得有理想的排名。并且,在这样的思想指导下,人们往往片面追求链接效应,忽略了SEO对于内容、结构、关键词等方面的分析和改进,而后者才是用户和搜索引擎长期关注的焦点。网络营销专家冯英健博士认为R值的高低应该是包括SEO在内的搜索引擎营销所产生的自然结果而不应作为追求的目标。

结论:在SEO的过程中,不能忘记内容建设,不能忘记优质外链,但忘掉PR可没什么大不了的。

来源:月光博客


Public @ 2016-05-29 15:39:06

Google Medic全面核心算法更新

Google Medic全面核心算法更新,发生在2018年8月,主要影响了医疗领域的搜索排名。这次更新主要是为了提高搜索质量,让高质量的内容更容易被发现,并降低非常规网站的排名。更新亦涵盖了其他领域。这次更新改变了以往的排序规则,增加了新的排名因素,比如网站的历史记录、用户反馈、技术优化等。这一次更新在网络营销行业产生了巨大的影响,许多网站的排名受到明显影响,但在更新后,优质的网站和内容获得了更多

Public @ 2023-04-07 11:50:28

网页评级是什么?如何提高网页评级

很多搜索引擎为了增加和改善网站的文章收录情况,提供了很多的辅助策略,如页面数据提交、各种的推送端口、原创数据提交、网站地图地址提交等。对于SEOer来说,虽然这种做法没有一个明确的指示到底有没有用,都是需要去做的。因为做了总比没做要好,做了之后万一有用呢。如果做了这些辅助策略后网站的收录还是不见涨该怎么办呢?那我们就需要针对内部链接做结构性优化调整——网页重要性评级。网页评级是什么网页评级(Sou

Public @ 2014-10-27 15:39:02

PageRank的计算方法以及影响因素

PageRank计算方法: PageRank是一个网页的数量化度量,反映了一个网页被其他网页所引用的情况。PageRank算法根据一个页面的链接数量和质量来确定该页面的相对重要性。PageRank的计算方法如下: 1. 所有页面初始的PageRank值为1 2. 对每个页面,计算其被其他页面链接的数量和质量,将这些值作为该页面的权重值 3. 将这些权重值分配给该页面链接到的其他页面,以提升这些

Public @ 2023-03-28 06:00:20

Matt Cutts谈PR和PR更新

大家都注意到前两天Toolbar(工具条)PR已经更新了。Matt Cutts发了一个帖子,回答一些关于PR和PR更新的问题。问:我很好奇PR值在内部是怎样存储的?是小数,就像人们猜测的,还是整数?答:把它想为小数更准确。当然目前我们内部的PR计算比toolbar显示的0-10要长的多。问:我需要知道这个吗?我知道PR能告诉我什么,我为什么要在乎?也就是说对普通网站来说,PR有什么目的?答:我想这

Public @ 2012-12-27 15:39:04

更多您感兴趣的搜索