Categories


Tags


HITS算法

  HITS算法

整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容及代码片段有且仅有借鉴意义。

  



HITS算法(Hypertext-Induced Topic Selection),也称为Hubs and Authorities algorithm,是一种用来计算图中节点相对重要性的算法。它是Larry Page and Sergey Brin 在1998年首次提出,以提高他们搜索引擎Google的网页检索准确性。HITS算法通过分析不同节点间的连接关系来鉴定节点的重要性分数:一个节点被称为网页中一个著名的Authority(权威性节点),另一个节点被称为Hub(节点中心性)。

算法的步骤如下:

1. 初始化每个节点的Authority score和Hub score为1。

2. 计算每个节点都有谁链接它,这些链接它的节点就是它的**Incoming Linker**;计算它指向哪些节点,这些节点称为它的**Outgoing Linker**。

3. 计算每个节点的新Authority score:节点的新Authority score等于它收到的来自上一次迭代计算的Incoming Linker的Hub score之和。

4. 计算每个节点的新Hub score:节点的新Hub Score等于它收到的来自上一次迭代计算的Outgoing Linker的Authority score之和。

5. 重复执行上述步骤,直至Authority score和Hub score不再改变为止。

最终每个节点的Authority score和Hub score就是它的重要性分值。节点的Authority score可以反映它在整个网站中的权威性,Hub score来反映它在整个网站中的中心性。

Public @ 2023-02-27 07:00:01 整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容有且仅有借鉴意义。

浅谈网页搜索排序中的投票模型

前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式,每个州根据其人口多少,有几十或几百的“州票”,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的“州票”,然后统计所有候选人的“州票”多少,获得最多

Public @ 2010-03-16 16:21:58

李彦宏超链分析和Google PR专利的区别

最早了解李彦宏超链分析专利是在洪波的博客中看到一篇文章:超链分析和PageRank的专利问题,才第一次知道百度总裁李彦宏曾经申请并获得对于超链接分析的专利,这份专利申请文件在美国专利局网站看到。李彦宏这个专利申请是在Google申请他们自己的PageRank专利之前的。由于这两份专利都是研究网页链接的,而且这两个专利的发明人是现在两大搜索引擎的创始人,所以很多人对这两个技术专利分不大清楚。甚至有的

Public @ 2012-05-15 15:39:01

HITS算法

HITS算法是一种采用迭代计算的网络算法,用于计算网络中节点的权重。该算法主要用于网络信息检索等计算技术。HITS算法与传统的关键词检索不同,关键词检索是以词语为基础,以文档为主要检索对象,结果通过匹配检索关键词的文档及其相关性程序来返回结果。而HITS算法则是以链接为基础,以网页为主要检索对象,通过计算每个页面的被链接的频度和链接其它页面的重要程度来决定查询结果的排序。该算法基于“authr

Public @ 2023-02-25 06:01:28

更多您感兴趣的搜索

0.577233s