Categories


Tags


新浪死链处理经验分享

在第四次深“度”接触结束后,spider工程师表示新浪的死链处理工作一直效果不错,提醒学堂应该请其做个分享。新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请王久明分享一下新浪在死链处理和死链预防(重要页面因修改而产生死链)方面的经验。

一、在以下背景下会较多产生死链:

1、时政新闻的敏感性;

2、来自监管的删除需求;

3、频道(编辑)自身删改的需求;

4、搜索方期望资源方主动优化和定期清除的需求

二、死链分类:

由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:

1、协议死链,服务器端返回HTTP状态码404;

例如:‘谁在伪善’http://news.sina.com.cn/movie/music/1999-06-15/2965.shtml

2,内容死链,服务器端返回HTTP状态码200,无法设置为404;

例如:http://news.sina.com.cn/c/2015-04-23/184531753084.shtml

3,页面需要用户和蜘蛛可以正常访问,但由于删改或误操作导致反复上下线形成协议死链或内容死链。例如:http://news.sina.com.cn/2015-12-05/doc-ifxmhqaa9933763.shtml

上线后又下线,后又上线,甚至反复多次。由于下线期间存在协议死链或内容死链的情况,导致百度认为该页面应该被删除,不被收录,且即使后续重新上线也无法恢复收录。对于这种情况,应加以预防。

三、解决方案:

1、协议死链,这个最符合HTML标准处理方式,站点方面无须多做什么,如果需要百度快速处理可以通过百度站长平台的死链提交工具(/college/courseinfo?id=267&page=4#h2_article_title18)进行主动提交

2,无法设置协议死链接,仅主体内容文本被删除的内容死链死链,新浪的处理方法是:

1)走事先之制定好的《死链标准流程》:用站内标准内容死链模板页面(告诉用户该页无法找到)覆盖需要删除的页面,5秒后跳转到统一的全站导航页,以减少用户流失。

2)根据需要,比如根据特定关键词圈定一批最终需要处理为协议死链的敏感页面,将这些页面链接放到一个文件里,由专人在服务器端修改成协议死链。通过百度站长平台工具进行死链提交

3,针对反复上下线导致百度误判为死链的情况,新浪的预防办法是:

1)制度上:系统后台设置提醒,提醒编辑上线后除非特殊情况不要下线;

2)功能上:这种情况在专题运营中最常见,且影响比单篇新闻页要大,由于我站点运营规定是不能删除页面的,因此在系统后台将“删除专题(对编辑来说就是删除该专题)”和“将专题调整为不对外显示(对编辑来说不是删除,而是暂时下线,调整为外网用户无法访问,可随时再次重新上线)”两个功能严格区分开,并提供回收功能。针对“将专题调整为不对外显示”这种情况,不再将页面更新为内容死链(页面无法找到),以免被百度误判。专题页面仍可访问,只是站点不设置入口、不进行推广,用户没有访问来源而已。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2013-02-21 15:36:49

搜索公开课复盘之《搜索基础展现解读》

本次公开课是由阿里巴巴集团技术专家为大家带来关于搜索基础的详细解读。以下是本次公开课的复盘内容: 首先,演讲嘉宾向我们介绍了搜索引擎的定义和基础原理,搜索引擎的目的是帮助用户快速找到所需信息,其核心原理是“索引 + 检索”,即将互联网上的信息按照一定的规则存储在搜索引擎内部的索引中,用户输入关键词进行检索时,搜索引擎会根据索引中的规则查询相关信息并呈现给用户。 接下来,演讲嘉宾介绍了搜索引擎检

Public @ 2023-04-29 01:50:17

A5营销团队告诉我的SEO诊断那些事

1. 确定作为搜索引擎优化目标的关键词及词组。 2. 核实网站内部链接结构和关键字使用,确保 SEO 因素的合理利用。 3. 优化网页的内容和 Meta 标签,增强关键字的多样性。 4. 审查网站结构、导航等,减少爬虫抓取的延迟和避免错误页面产生。 5. 执行网站定位与改善,提升搜索结果排名。 6. 根据预算进行收费关键字广告投放。 7. 通过关键字引导对网站统计报告分析,研究优化

Public @ 2023-02-24 16:54:26

大量死链对搜索引擎来讲,有什么影响?

大量死链对搜索引擎的影响如下: 1. 影响爬虫的抓取效率:死链会占用爬虫的抓取时间和资源,影响其抓取效率。 2. 影响网站权重和排名:死链会降低网站的权重和排名,因为搜索引擎会认为网站质量不高。 3. 影响用户体验:用户在访问网站时遇到死链会产生不良的用户体验,降低用户对网站的满意度,从而影响用户留存率。 4. 降低页面权重:搜索引擎发现网站有大量死链,会认为网站的内容质量不高,因此可能会

Public @ 2023-06-14 20:50:25

如何避免和处理死链接?

1、网站改版最容易产生死链的改版之前的页面如果有价值尽量不要删除和修改Url,若需要更换域名或Url分配规则,那一定要将之前的url进行301跳转到对应的Url;若老的数据必须删除,那删除的所有页面Url要进行整理和提交死链。2、对发现的死链接如何处理将收集好的所有死链接粘贴到网站根目录的一个文档中,再把文档地址提交到百度资源平台-搜索服务-资源提交-死链提交--添加新数据--填写死链文件地址;若

Public @ 2017-11-05 15:36:52

更多您感兴趣的搜索

0.110400s