Categories


Tags


HITS算法

HITS算法(Hypertext-Induced Topic Selection),也称为Hubs and Authorities algorithm,是一种用来计算图中节点相对重要性的算法。它是Larry Page and Sergey Brin 在1998年首次提出,以提高他们搜索引擎Google的网页检索准确性。HITS算法通过分析不同节点间的连接关系来鉴定节点的重要性分数:一个节点被称为网页中一个著名的Authority(权威性节点),另一个节点被称为Hub(节点中心性)。 算法的步骤如下: 1. 初始化每个节点的Authority score和Hub score为1。 2. 计算每个节点都有谁链接它,这些链接它的节点就是它的**Incoming Linker**;计算它指向哪些节点,这些节点称为它的**Outgoing Linker**。 3. 计算每个节点的新Authority score:节点的新Authority score等于它收到的来自上一次迭代计算的Incoming Linker的Hub score之和。 4. 计算每个节点的新Hub score:节点的新Hub Score等于它收到的来自上一次迭代计算的Outgoing Linker的Authority score之和。 5. 重复执行上述步骤,直至Authority score和Hub score不再改变为止。 最终每个节点的Authority score和Hub score就是它的重要性分值。节点的Authority score可以反映它在整个网站中的权威性,Hub score来反映它在整个网站中的中心性。

Public @ 2023-02-27 07:00:50

李彦宏超链分析专利,超链分析算法的作用

互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。李彦宏超链分析示意图这其实就是现实生活中链接关系的应用:要判断哪

Public @ 2020-01-04 15:39:01

TrustRank算法

TrustRank算法是一个用于检测Web图谱(Web graphs)的可靠性和安全性的算法。它是由斯坦福大学的一组研究人员开发和发布的。TrustRank的思想是基于之前的 PageRank算法,但是与PageRank不同的是,TrustRank使用了人工干预的方式,将一些网站标记为可信、不可信或者中等可信度。然后,利用这些标记,计算每个网站的信任值,表示对这个网站的访问与使用是否安全和可靠。这

Public @ 2023-04-05 05:50:11

HITS链接分析算法

HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HI

Public @ 2023-03-02 20:01:00

更多您感兴趣的搜索

0.536491s