sogou spider 喜欢收录什么样的页面?
- 威海Spider 威海sogou spider
- 1233
内容优良而独特的页面,如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
链接层次较浅的页面,过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
重定向次数越多的页面,越有可能被 sogou spider 丢弃。
内容优良而独特的页面,如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
链接层次较浅的页面,过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
重定向次数越多的页面,越有可能被 sogou spider 丢弃。
360搜索蜘蛛IP段: 以下是360搜索的蜘蛛IP段: - 101.226.68.0/24 - 101.227.0.0/16 - 106.12.0.0/15 - 114.113.192.0/18 - 115.238.0.0/17 - 117.121.0.0/17 - 117.122.0.0/15 - 119.147.128.0/17 - 119.188.0.0/16 - 120.204.0.0
搜索蜘蛛IP段 1、百度蜘蛛:220.181.100-220.181.111 2、360搜索蜘蛛:36.110.0-36.110.255 3、新浪蜘蛛:61.135.160-61.135.160 4、搜狗蜘蛛:182.118.7-182.118.15 蜘蛛IP被拦截的问题解决方法 1、根据不同的蜘蛛IP段添加搜索蜘蛛的IP白名单,以免被拦截; 2、根据不同的蜘蛛访问网站的添加Us
sogou spider 对于同一个 IP 地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。如果您认为 sogou spider 对于您的网站抓取过快,请与我们联系,最好能提供访问日志中sogou spider 访问的部分。点此投诉spider抓取过快
sogou spider 支持 robots 协议,您可以在网站的根目录放置 robots.txt。robots.txt 的规则请参阅 http://www.robotstxt.org/。需要注意的是,最新更新的 robots.txt 可能需要几个星期才能体现出效果来,另外,被您禁止 sogou spider 收录的网页将不能在搜狗搜索引擎上检索到。