Categories


Tags


360搜索蜘蛛IP段及蜘蛛ip被拦截的问题解决方法

360Spider的ip,我们已经公开在这里辣~:

http://www.so.com/help/spider_ip.html

360Spider的UA(UA是蜘蛛访问的时候,在服务器中留下的访问签名信息,凡是下面这个UA,就代表是360Spider来过了):

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider

360robots协议支持FAQ:

http://www.haosou.com/help/help_3_2.html

关于蜘蛛被拦截:

蜘蛛被拦截一般是网站服务器或防火墙在做设置时,不小心将搜索引擎的蜘蛛做了拦截,导致蜘蛛无法访问,获取不到网站信息。这种问题会导致网站不收录或收录出现异常的问题

蜘蛛被拦截的常见现象有:

1、360Spider 无访问记录

2、360Spider 有访问页面的记录,但是访问的http状态为非200的状态,主要状态码有:404、403、0、503、504、521等

3、部分优质内容不收录或者收录出现异常(如优质内容的收录数量剧烈下降等,注意:关于内容收录的维度,也请参考我们之前发布的各类算法和白皮书,不清楚的小伙伴可以看这里)

如下面这个站点,就是典型的蜘蛛被拦截,我们没有办法收录到,其表现为http抓取状态为0

如何解决?

1、将我们的蜘蛛ip、UA加入到可访问的白名单

2、加白之后,尽快通过网站收录提交入口,提交网站的收录,并通过站长平台,提交网站的sitemap,观察一段时间(一般建议观察15-30天)看是否开始有收录

3、向您的空间服务商进行反馈,告知其加白我们的蜘蛛ip以及ua

以上就是我们解决蜘蛛被拦截的一个基本思路,各位小伙伴清楚了波~

如果仍然有疑问或者需要我们协助,可以向我们发邮件进行反馈,我们的反馈邮箱是:service-so@360.cn

感谢大家对360搜索的支持

来源:360站长平台


Public @ 2015-12-02 15:38:48

如何和搜索引擎爬虫对话

作为AI语言模型,我无法实际与搜索引擎爬虫对话,但我可以提供以下有关如何处理爬虫的指导: 1. 确保您的网站结构和内容易于爬行。将所有页面都链接在一起,并为每个页面添加描述性的标题和标记。 2. 在网站中使用robots.txt文件来指定搜索引擎爬虫的访问权限。 3. 将所有内容放在HTML中,而不是JavaScript或Flash中,因为搜索引擎爬虫无法识别JavaScript和Flash内容

Public @ 2023-05-27 13:50:15

【干货】简单两步,教你识别百度蜘蛛

”近期,小编经常收到开发者关于“哪些蜘蛛是百度搜索的”、“如何才能正确识别百度蜘蛛”的提问。今日干货带你简单两步即可识别百度蜘蛛一、查看UA信息如果UA信息不对,可以直接判断该蜘蛛为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,分别如下:【移动UA】1、Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KH

Public @ 2019-09-16 15:38:37

更多您感兴趣的搜索

0.438110s