Categories


Tags


百度搜索算法规范详解-1.页面内容质量

1.页面内容质量

1.1 飓风算法 3.0 ——针对页面内容质量问题

百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。

飓风算法主要针对以下页面内容质量问题:

1.1.1 恶劣采集行为:

(1)存在大量从其他站点、智能小程序或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。

问题示例1:文章有明显采集痕迹

(2)存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。

问题示例2:文章内容逻辑性差,阅读体验差

(3)站点或智能小程序内存在大量采集内容,自身内容生产力极差。

1.1.2 跨领域采集问题:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。

问题示例:美食类智能小程序发布足球相关内容

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。

问题示例:智能小程序内容涉及多个领域

1.1.3 站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容质量低、相似度高

关于飓风算法的更多信息请参考:

2019.8.22 【官方说法】飓风算法3.0解读

2019.8.8 飓风算法3.0即将上线,控制跨领域采集及站群问题

2018.9.20 【官方说法】飓风算法2.0解读

2018.9.13 百度搜索将推出飓风算法2.0,严厉打击恶劣采集行为

2017.7.4 百度推出飓风算法,严厉打击恶劣采集

1.2 劲风算法 ——针对恶劣聚合页问题

2020年2月,百度搜索技术团队发现,部分网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注,上线劲风算法,控制恶意构造聚合页的问题对搜索用户的影响。

聚合页,是指页面并无文章主体内容,而是多个页面的索引链接围绕在特定主题下的信息整合页。

恶劣聚合页问题主要包括以下四种类型:

(1)页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

问题示例1:站点内容领域分散

(2)页面内容与标题及页面中标记的标签不符。

问题示例2:页面内容与标题不符

(3)由网站搜索功能生成的静态搜索结果页。

问题示例3:静态搜索结果页

(4)空短、无有效信息、失效的聚合页。

问题示例4:无有效信息的聚合页

关于劲风算法的更多信息请参考:

2020.3.5 【官方解读】劲风算法官方解读

2020.2.27 劲风算法即将上线

1.3 细雨算法2.0 ——针对B2B领域低质问题

2018年6月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。

2019年11月,百度搜索发布细雨算法2.0,针对B2B行业的恶劣违规问题及低质内容。

细雨算法主要针对以下问题:

1.3.1 页面标题作弊及误导:

(1)非公司官网,title中包含“官网”等字样,误导搜索用户认为是官网

问题示例4:

(2)页面title中堆砌相近关键词;

问题示例5:

(3)页面title中穿插火星文字或者特殊符号,影响正常阅读;

问题示例6:

(4) 页面title中穿插受益方式。

问题示例7:

1.3.2 页面正文内容中存在受益信息:

(1)正文内容不完整,频繁穿插变形的受益方式。

具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用“英文字母”、“汉字谐音”、“特殊符合”、“全角符合”等方式代替联系方式,穿插在正文内容中。

举例:5992八⑧⑧⑧

举例:13800138000

问题示例8:

(2)文章的配图图片中存在受益联系方式。

具体是指:图片中联系方式水印面积较大,严重损害浏览体验。

问题示例9:

(3)正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。

问题示例10:

1.3.3 恶劣违规内容:

(1)页面内容恶劣采集。

如:拼接内容、纯采集内容、跨领域采集内容等。

问题示例:B2B领域小程序采集时事新闻

(2)发布软文信息。

问题示例:利用小程序页面发布软文,页面标题是“垃圾车厂家哪家好“,内容是品牌软文,对用户产生误导

(3)发布无法满足用户需求的空白页面,对用户完全无价值。

问题示例:该小程序页面为空白页面

(4)商品信息有误。

如:商品详情、价格等与实际情况不符

问题示例:商品价格与实际情况不符

(5)功能不可用。

如:交易、联系电话、查看详情等交互功能不可用等情况。

1.3.4 低质内容:

1、图片内容低质。

如:图片内容与文字描述不一致、图片嵌入电话号码、图片质量极低影响阅读体验等。

问题示例:图片中大量嵌入联系电话

2、页面内容低质。

如:页面中只有图片无有效信息,或信息提供不完善等情况。

问题示例:网站仅有图片作为展示,没有文字说明

关于细雨算法2.0的更多信息请参考:

2019.11.15 【官方说法】细雨算法2.0解读

2019.11.7 针对B2B领域低质内容,细雨算法即将升级

2018.7.5 【官方说法】B2B领域细雨算法解读

2018.6.28 百度搜索推出细雨算法 促进供求黄页类站点生态健康发展

1.4 蓝天算法 ——针对目录交易问题

2016年11月,百度搜索推出蓝天算法,持续打击新闻类站点售卖软文、目录的行为,还用户一片搜索蓝天。被“蓝天算法”所覆盖的站点将会被降低其在百度搜索系统中的评价。

问题示例11:

关于蓝天算法的更多信息请参考:

2016.11.21 百度推出蓝天算法,严厉打击新闻类站点售卖目录

目录

1. 页面内容质量

2. 用户需求满足

3. 用户体验友好

4. 搜索公正及用户安全

来源:百度搜索资源平台 百度搜索学堂


Public @ 2021-10-12 15:21:30

百度升级『蓝天算法』,加强“站点构造目录发布低质内容”识别能力

近日,百度宣布升级其“蓝天算法”(蓝天保卫战),进一步加强对于“站点构造目录发布低质内容”行为的识别能力。 蓝天算法是百度针对于网站违规行为的防御机制,旨在保护搜索结果的高质量。此次升级的重点,是针对利用黑帽SEO手段,构造目录、发布海量重复、无意义的低质内容的站点。 据了解,新版本的蓝天算法,将基于机器学习、自然语言处理等技术手段,对这类站点进行更加精准的识别。同时,算法团队将不断收集和整理

Public @ 2023-04-21 01:50:33

百度搜索推出细雨算法 促进供求黄页类站点生态健康发展

为保证搜索用户体验,促进供求黄页类B2B站点生态健康发展,百度搜索将于7月中旬推出细雨算法,命中算法的站点将会受到限制展现的处罚。算法主要针对以下问题:1. 页面标题作弊,包含冒充官网,title堆砌关键词等情况;示例:2. 商家为了在页面中频繁保留联系方式而做出的各种低质受益行为,如受益方式变形、穿插受益等。示例:温馨提示:算法上线前,我们会通过搜索资源平台给存在问题的站点发送站内信、邮件,还请

Public @ 2020-09-02 15:21:40

百度搜索算法规范详解-1-引言

百度搜索算法是百度搜索引擎为了更好的实现用户查询意图,提供最精准的查询结果,而进行的一系列的算法处理。根据用户的查询意图,百度能够匹配出最接近的查询结果,达到搜索更加广泛,结果更加精准的目的。 百度搜索算法主要有索引算法、聚类算法和拼写检查算法等。索引算法是百度搜索引擎的核心算法,它能够在搜索引擎无限索引大量信息后,根据查询意图将索引结果按照词频、普及率和用户点击率排序返回到用户搜索结果中。

Public @ 2023-03-01 19:48:36

百度搜索算法规范详解-2.用户需求满足

1. 搜索结果要与用户查询的关键词相关 百度搜索算法中最重要的一个规范是,搜索结果必须要与用户的查询关键词相关联。这意味着搜索结果必须包含查询关键词,或与查询关键词有着密切的相关性。如果搜索结果与查询关键词没有任何关联,那么搜索引擎就不会将其视为有效的结果。 2. 搜索结果应满足用户的期望 百度搜索算法的另一个重要规范是,搜索结果必须满足用户的期望。这意味着搜索引擎必须首先了解用户的意图,然

Public @ 2023-04-02 11:50:25

更多您感兴趣的搜索

0.513673s