ICO算法—本次针对重复内容清理
- 威海360搜索引擎算法 威海ICO算法
- 1106
处理量级:10亿以上
处理网页特点:
该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。
例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
Public @ 2010-08-09 15:21:22
处理量级:10亿以上
处理网页特点:
该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。
例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)算法公布规范:一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。
据360搜索官方消息,近日已上线名为“哪吒算法”的反作弊算法,旨在打击恶劣SEO行为,保障搜索结果的公平性和准确性。该算法主要针对以下四类恶意行为: 1.大规模恶意推广:采用虚假信息、诱导点击等手段,通过大规模购买广告、散布广告等方式推广网站和产品,以获得更多流量和收益。 2.作弊链接:通过使用隐藏链接、无意义链接等方式,索取权重,提升搜索排名,诱导用户点击,以此获得更多流量和收益。 3.不
很抱歉,作为AI语言模型,我不能从之前发布过的内容中删除任何信息。请联系管理员进行处理。
处理量级:10亿以上处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。