Categories


Tags


浅谈404问题

今天为什么要说一下404问题呢,最近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点是值得肯定的。通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句“该内容已删除”,但其都没有。可以发现目前这个搜藏中的url仍然正常返回200,http://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的后果:搜索引擎将花费大量的资源在这种无效页面上,那么,同等耗损下用在重要页面上的资源将被大量挤占,可想而知,正常优质页面在搜索引擎的部分表现将受到影响。经过我们运营同学的多方沟通下至今仍未进一步处理。我觉得,21世纪第二个十年了,这种问题不应该再存在了的。

好吧,承认我被打败了。简单说一下:

404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。因此,出来了两类问题:第一,网页临时性打不开;第二,页面永远无法打开。针对第一类问题,我建议不要立刻返回404,而是使用503。503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。

回归之前那个网站,删除内容后该页面没有任何价值。最恰当的处理是:

1、直接做死链处理并返回404;

2、在百度站长平台死链提交工具中提交死链sitemap。

最后呢,提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:

1、及时删除相关垃圾页面,并做404处理;

2、制作符合要求的死链sitemap;

3、登录百度站长平台,进入死链提交工具提交死链sitemap。

如果大家对404问题还有别的疑问,大家可以到[学堂同学汇][学习讨论]《浅谈404问题》讨论贴中发表自己的看法,我们的工作人员会关注这里并与大家进行探讨。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-09-24 16:09:54

301重定向的意义你是否真的了解?能正确运用301重定向?

作为语言模型,我并没有我所居住的服务器进行重定向的权限,但我可以介绍一下301重定向的意义和正确运用。 301重定向是一种永久重定向,其作用是将一个URL(统一资源定位符)永久性地转移到另一个URL。当一个页面从原始URL被移动到新的URL时,301重定向将告诉搜索引擎这种变化,并将所有的外部链接、书签和搜索引擎中该网页的排名都转移到新的URL上。在网站进行页面优化时,如果某个URL需要被修改,

Public @ 2023-05-31 18:00:38

SEO优化为什么不建议使用中文域名?有哪些弊端?

中文URL对于国内搜索引擎的优化效果是肯定的,毕竟有很多现实的实例已经证明了这一点,只是子凡觉得中文可以适当的使用,但是如果不合理的使用其实也会带来一定的困扰吧!从事SEO行业的人都知道页面URL的处理是优化过程中一个非常重要组成部分,例如URL的伪静态、层级精简、树状结构等。这些细节的处理不仅对搜索引擎更友好,用户体验也会有一定的提升,因此这些对URL的处理必定是可以讨好搜索引擎的。而说到用户体

Public @ 2016-03-22 16:12:02

网站404页面优化

今天和大家分享“404页面是什么?优化404页提示我们想了解网站死链接,空页面面排名的影响很大,因为直接影响到网站的综合分数,会降低网站的排名,让百度认为你的网站不能为用户提供稳定的内容,当然我们可以用404页来优化死链接和空页面,1,什么是404页面?当用户访问服务器资源的时候,资源丢失,便会返回一个404状态码,这种404状态码就称为404页面,或是在用户输入错误的页面链接时,访问的资源肯定是

Public @ 2022-11-29 16:09:56

Apache IIS/.net 制作404页面

Apache 404 页面: 1. 创建一个名为“404.html”的文件,该文件将成为您的404错误页面。 2. 将此文件上传到您网站的根目录(或子目录,如果您希望针对特定子目录生成404页面)中。 3. 打开您网站的.htaccess文件并添加以下代码: ``` ErrorDocument 404 /404.html ``` 4. 现在,每当用户在您的网站上访问不存在的页面时,将自动重定

Public @ 2023-06-05 12:50:13

更多您感兴趣的搜索

0.468920s