Categories


Tags


ICO算法—本次针对重复内容清理

处理量级:10亿以上

处理网页特点:

该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。

例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。


Public @ 2010-08-09 15:21:22

ICO算法—本次针对重复内容清理

处理量级:10亿以上处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。

Public @ 2010-08-09 15:21:22

360搜索“哪吒算法”上线 严厉打击恶劣seo骗取流量行为

近日,360搜索上线了“哪吒算法”,旨在严厉打击恶劣SEO骗取流量行为。该算法主要针对利用不规范手段提高网站权重、优化关键词排名、欺骗用户的行为。360搜索表示,在运行哪吒算法后,将对不正当手段进行打击,恢复搜索的本来面目,实现搜索结果的公平、公正与可信。 根据360搜索的介绍,哪吒算法将细致地分析网站的各个维度,包括页面结构、内容质量、外部链接等,通过机器学习等技术,将全面、深入地了解每个网站

Public @ 2023-04-24 23:00:14

360搜索ICO算法简介

ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)算法公布规范:一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。

Public @ 2016-10-21 15:21:23

ICO算法—本次针对重复内容清理

处理量级:10亿以上处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。

Public @ 2010-08-09 15:21:22

更多您感兴趣的搜索

0.569322s