Categories


Tags


HITS算法

HITS算法(Hypertext-Induced Topic Selection),也称为Hubs and Authorities algorithm,是一种用来计算图中节点相对重要性的算法。它是Larry Page and Sergey Brin 在1998年首次提出,以提高他们搜索引擎Google的网页检索准确性。HITS算法通过分析不同节点间的连接关系来鉴定节点的重要性分数:一个节点被称为网页中一个著名的Authority(权威性节点),另一个节点被称为Hub(节点中心性)。 算法的步骤如下: 1. 初始化每个节点的Authority score和Hub score为1。 2. 计算每个节点都有谁链接它,这些链接它的节点就是它的**Incoming Linker**;计算它指向哪些节点,这些节点称为它的**Outgoing Linker**。 3. 计算每个节点的新Authority score:节点的新Authority score等于它收到的来自上一次迭代计算的Incoming Linker的Hub score之和。 4. 计算每个节点的新Hub score:节点的新Hub Score等于它收到的来自上一次迭代计算的Outgoing Linker的Authority score之和。 5. 重复执行上述步骤,直至Authority score和Hub score不再改变为止。 最终每个节点的Authority score和Hub score就是它的重要性分值。节点的Authority score可以反映它在整个网站中的权威性,Hub score来反映它在整个网站中的中心性。

Public @ 2023-02-27 07:00:50

Google PR劫持

Google PR劫持是指恶意攻击者修改网站的PageRank值,以使其在Google搜索结果中获得更高的排名。攻击者可以通过篡改网站内容、利用漏洞或使用黑帽SEO技术等方式来实现PR劫持。这种攻击可能会导致合法网站的访客数量锐减,进而影响其商业利益。为了避免PR劫持,网站管理员应当做好网站安全防护工作,及时更新网站补丁和加强网站访问控制等措施。

Public @ 2023-06-19 00:00:07

浅谈网页搜索排序中的投票模型

前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式,每个州根据其人口多少,有几十或几百的“州票”,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的“州票”,然后统计所有候选人的“州票”多少,获得最多

Public @ 2010-03-16 16:21:58

HITS链接分析算法

HITS(Hyperlink - Induced Topic Search)链接分析算法诞生在1997年,该算法是由康奈尔大学中的一位博士提出,并且该算法沿用于全球多个搜索引擎当中。当然,不同的搜索引擎针对于该算法的侧重点和内部公式都有不一的算法结构调整,并且HITS算法也是链接分析中最为重要的基础算法之一。对于目前国内的整体搜索引擎而言,百度作为国内的搜索引擎领头羊,我会带着HITS的公开文档针

Public @ 2009-11-28 15:39:11

更多您感兴趣的搜索

0.541946s