Categories


Tags


网站日志里大量的304、404蜘蛛状态码对于优化有影响吗?

lv_eastar 提问于 3年 之前

Zac老师,您好,我们网站是织梦的,收录有3万多。日志分析百度蜘蛛每天访问次数1739,抓取量2556。

1.其中304状态的百度蜘蛛抓取量有300左右。这样是不是不好?

2.另外还有404状态的百度蜘蛛抓取量150左右,看了404的页面有/plus/md5.php、/www.root.rar等都是从来没有出现过的页面。这是怎么回事,是否也影响优化?

1 个回答

Zac 管理员 回答于 3年 之前

304状态码是说页面从上次抓取后没有变化,所以浏览器或蜘蛛用以前的缓存就可以了,所以并没有返回页面html代码。如果这些页面已经被收录了,而且也确实没有任何变化,那么304没关系。如果页面并没有被收录,或者其实是有更新的,那么304就是错误的,会使搜索引擎蜘蛛抓取不到页面比如。所以需要检查返回304码的页面到底是什么情况。

404状态码是页面不存在。日志中经常会出现不存在的页面被访问,不过通常不是搜索引擎蜘蛛访问,是有人在试图扫描网站漏洞,看看特定位置是否有特定文件,所以URL是挺规则的,就是某些CMS应该有的文件,而不是莫名其妙的错误,比如URL被截断了。如果是百度蜘蛛访问这些URL,我很少看到,可能是这些URL在什么对方出现过,被百度发现了,可能是自己网站,可能是其他网站,可以搜索一下这些URL。

404通常不会有什么问题,只要别太多,太多的话搜索引擎可能觉得网站是不是已经没人维护了,因此降低信任度。

来源:SEO每天一贴 Zac 昝辉


Public @ 2019-07-31 15:53:19

网站一个内容有多个不同的收录,对网站有没有影响

题:网站一个内容有多个不同的收录,对网站有没有影响回答:有一些网站出现了参数类型的收录,例如:www.xxx.com/1.html?123  还有一种则是伪静态网站静态URL和动态URL全部被收录了!这个时候的解决办法是在Head中增加canonical标签,来确定权威链接,告知搜索引擎!来源:A5营销

Public @ 2019-04-10 15:55:20

百度快照停滞不更新了是什么原因

作为语言人工智能模型,我无法确定具体原因,但可能是由于以下原因之一: 1.网站内容没有更新。如果您的网站内容不经常更新,百度爬虫将无法找到新的内容,并且不会更新快照。 2.网站的技术问题。如果您的网站存在技术问题,例如服务器响应时间太长,缓存设置不正确等,这可能会导致百度爬虫无法访问您的网站,并且无法更新快照。 3.百度爬虫的更新频率有所下降。百度爬虫可能会对一些网站的更新频率进行动态调整,

Public @ 2023-06-25 01:00:14

网站存在重复链接会怎么样

张新军 提问于 3年 之前网站存在图片链接跟文字链接相同的情况,就是标题指向一个链接,然后图片指向相同的链接,会被搜索引擎惩罚吗?1 个回答Zac 管理员 回答于 3年 之前不会怎么样,也不会被惩罚。页面上有两个或多个链接指向同一个页面,这很正常。比如网站logo链接到首页,主导航和面包屑导航的“首页”也指向首页,还可能有页脚的链接,这是网站正常设计,有搜索引擎之前就这么设计网站了,搜索引擎为什么

Public @ 2010-11-07 15:53:23

更多您感兴趣的搜索

0.423614s