Categories


Tags


360搜索蜘蛛IP段及蜘蛛ip被拦截的问题解决方法

360Spider的ip,我们已经公开在这里辣~:

http://www.so.com/help/spider_ip.html

360Spider的UA(UA是蜘蛛访问的时候,在服务器中留下的访问签名信息,凡是下面这个UA,就代表是360Spider来过了):

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider

360robots协议支持FAQ:

http://www.haosou.com/help/help_3_2.html

关于蜘蛛被拦截:

蜘蛛被拦截一般是网站服务器或防火墙在做设置时,不小心将搜索引擎的蜘蛛做了拦截,导致蜘蛛无法访问,获取不到网站信息。这种问题会导致网站不收录或收录出现异常的问题

蜘蛛被拦截的常见现象有:

1、360Spider 无访问记录

2、360Spider 有访问页面的记录,但是访问的http状态为非200的状态,主要状态码有:404、403、0、503、504、521等

3、部分优质内容不收录或者收录出现异常(如优质内容的收录数量剧烈下降等,注意:关于内容收录的维度,也请参考我们之前发布的各类算法和白皮书,不清楚的小伙伴可以看这里)

如下面这个站点,就是典型的蜘蛛被拦截,我们没有办法收录到,其表现为http抓取状态为0

如何解决?

1、将我们的蜘蛛ip、UA加入到可访问的白名单

2、加白之后,尽快通过网站收录提交入口,提交网站的收录,并通过站长平台,提交网站的sitemap,观察一段时间(一般建议观察15-30天)看是否开始有收录

3、向您的空间服务商进行反馈,告知其加白我们的蜘蛛ip以及ua

以上就是我们解决蜘蛛被拦截的一个基本思路,各位小伙伴清楚了波~

如果仍然有疑问或者需要我们协助,可以向我们发邮件进行反馈,我们的反馈邮箱是:service-so@360.cn

感谢大家对360搜索的支持

来源:360站长平台


Public @ 2015-12-02 15:38:48

【官方说法】只需两步,正确识别百度蜘蛛(User-Agent)

步骤一:查看 User-Agent 信息 在你的网站后台查看日志或者使用网站统计工具,可以查到每次访问你网站的 User-Agent 信息。百度蜘蛛的 User-Agent 格式如下: Baiduspider/数字(+版本信息) 例如:Baiduspider/2.0、Baiduspider/2.0b等。 步骤二:验证 IP 地址 验证访问你网站的 IP 是否是百度蜘蛛的 IP。可以在百度

Public @ 2023-04-11 07:50:16

百度不收录原因分析——Spider抓取篇

目前百度Spider抓取新链接的途径有两个,一是主动出击发现抓取,二就是从搜索资源平台的链接提交工具中获取数据,其中通过主动推送功能“收”上来的数据最受百度Spider的欢迎。对于站长来说,如果链接很长时间不被收录,建议尝试使用主动推送功能,尤其是新网站,主动推送首页数据,有利于内页数据的抓取。那么同学们要问了,为什么我提交了数据还是迟迟在线上看不到展现呢?那涉及的因素可就多了,在Spider抓取

Public @ 2012-08-02 15:38:46

更多您感兴趣的搜索

0.460026s