Categories


Tags


TrustRank算法

TrustRank算法是早年基于链接关系的排名算法。TrustRank可以翻译为“信任指数”。

算法简介

TrustRank算法

TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank算法发明人还发表了一份专门的PDF文件,说明TrustRank算法的应用。感兴趣的读者可以在下面这个网址下载PDF文件:

TrustRank算法并不是由Google提出的,不过由于Google所占市场份额最大,而且TrustRank在Google排名中也是一个非常重要的因素,所以有些人误以为TrustRank是Google提出的。更让人糊涂的是,Google曾经把TrustRank申请为商标,但是TrustRank商标中的TrustRank指的是Google检测含有恶意代码网站的方法,而不是指排名算法中的信任指数。

基于这个假设,如果能挑选出可以百分百信任的网站,这些网站的TrustRank评为最高,这些trustrank最高的网站所连接的网站信任指数稍微降低,但也会很高。与此类似,第二层别信任的网站链接出去的第三层网站,信任度继续下降。由于种种原因,好的网站也不可避免的会接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数就越高,第一级网站点击距离越远,信任指数将依次下降。这样trustrank算法,就能给所有网站计算出相应的信任指数,离第一层网站越远,成为垃圾网真的可能性就越大。

算法描述

计算TrustRank值首先要选择一批种子网站,然后人工查看网站,设定一个初始TrustRank值。挑选种子网站有两种方式,一种是选择导出链接最多的网站,因为TrustRank算法就是计算指数随着导出链接的衰减,导出链接多的网站,在某种意义上可以理解为“逆向PR值”比较高。

另一种挑选种子网站的方法是选PR值高的网站,因为PR值越高,在搜索结果页面出现的概率就越大,这些网站才正是TrustRank算法最关注的、需要调整排名的网站,那些PR值很低的页面,在没有TrustRank算法时排名也很靠后,计算TrustRank意义就不大了。

根据测算,挑选出两百个左右网站作为种子,就可以比较精确地计算出所有网站的TrustRank值。

计算TrustRank随链接关系减少的公式有两种方式。一种是随链接次数衰减,也就是说如果第一层页面TrustRank指数是100,第二层页面衰减为90,第三层衰减为80。第二种计算方法是按导出链接数目分配TrustRank值,也就是说,如果一个页面的TrustRank值是100,页面上有5个导出链接,每个链接将传递20%的TrustRank值。衰减和分配这两种计算方法通常综合使用,整体效果都是随着链接层次的增加,TrustRank值逐步降低.

得出网站和页面的TrustRank值后,可以通过两种方式影响排名。一种是把传统排名算法挑选出的多个页面,根据TrustRank值比较,重新做排名调整。另一种是设定一个最低的TrustRank值门槛,只有超过这个门槛的页面,才被认为有足够的质量进入排名,低于门槛的页面将被认为是垃圾页面,从搜索结果中过滤出去。

虽然TrustRank算法最初是作为检测垃圾的方法,但在的搜索引擎排名算法中,TrustRank概念使用更为广泛,常常影响大部分网站的整体排名,TrustRank算法最初针对的是页面级别。在搜索引擎算法中,TrustRank值也通常表现在域名级别,整个域名的信任指数越高,整体排名能力就越强。


Public @ 2015-10-12 15:39:10

搜索引擎链接分析中的链接优化

链接优化是搜索引擎优化(SEO)中的一个重要方面,对于提高网站的排名和可见度非常关键。下面是一些常见的链接优化策略: 1. 内部链接优化:在网站的不同页面之间建立清晰的内部链接结构,使搜索引擎能够更好地抓取和理解网站的内容。这有助于提高页面之间的链接价值,并增加搜索引擎对页面的重要性评分。 2. 外部链接优化:获得高质量的外部链接指向自己的网站,这有助于提高网站的权威性和可信度。可以通过创建有

Public @ 2023-07-23 12:00:33

Google PR 值是什么?怎样计算?

Google PR值(PageRank)是Google用于评估网页重要性和引用关系的一种算法方法。PR值介于0到10之间,值越高表示网页的重要性越高。 PR值的计算基于网页的链接数和链接质量,即链接来源的重要性。一个网页被其他重要网页所连接时,它的PR值也会随之提高。 具体地,PR值的计算公式为: PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C

Public @ 2023-05-27 10:00:11

TrustRank算法

TrustRank算法是一个用于检测Web图谱(Web graphs)的可靠性和安全性的算法。它是由斯坦福大学的一组研究人员开发和发布的。TrustRank的思想是基于之前的 PageRank算法,但是与PageRank不同的是,TrustRank使用了人工干预的方式,将一些网站标记为可信、不可信或者中等可信度。然后,利用这些标记,计算每个网站的信任值,表示对这个网站的访问与使用是否安全和可靠。这

Public @ 2023-04-05 05:50:11

TrustRank算法

TrustRank算法是早年基于链接关系的排名算法。TrustRank可以翻译为“信任指数”。算法简介TrustRank算法TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank算法发明人还发表了一份专门的PDF文件,说明TrustRank算法的应用。感兴趣的读者可以在下面这个网址下载PDF文件:TrustRank算

Public @ 2015-10-12 15:39:10

更多您感兴趣的搜索