ICO算法—本次针对重复内容清理
- 威海360搜索引擎算法 威海ICO算法
- 847
处理量级:10亿以上
处理网页特点:
该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。
例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
处理量级:10亿以上
处理网页特点:
该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。
例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
亲爱的站长朋友们:大家好。互联网的快速发展离不开原创和稀缺的优质资源,而通过我们近期的数据分析和用户反馈发现,部分网站采取疯狂而低劣的采集手段,短时间内拼凑出大量低质量采集网页。这种行为使得互联网上内容拼接、偷换标题、过多垃圾广告等低质量的网页逐渐泛滥,不仅严重影响了正常用户的浏览体验,同时也导致优质原创内容无法优先展现,对用心构建原创和精品内容的网站也造成了一定的伤害。360搜索一直以来,以鼓励
360搜索最近上线了一款新算法,叫做“哪吒算法”,专为中小企业服务,旨在对抗恶劣的SEO骗取流量行为。该算法力图更尽快、更有效地捕获垃圾搜索流量,以保障搜索引擎可依托、更安全的搜索环境,从而推动中小企业的网络营销。 哪吒算法建立在360搜索新搭建的大数据检索技术上,利用其强大的流量管理能力和精准地大数据探测技术对网站不正当SEO行为进行进行挖掘和抓取,有效阻断败坏垃圾流量。此外,哪吒算法还利
处理量级:10亿以上处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)算法公布规范:一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。