Categories


Tags


apache、iis6、ii7独立ip主机屏蔽拦截蜘蛛抓取(适用vps云主机服务器)

* Apache:通过在网站主机的.htaccess文件中添加下面一行代码即可实现: `SetEnvIfNoCase User-Agent "bot|crawl|spider|Yahoo|ia_archiver| other_spider|Googlebot" bad_bot` * IIS6:打开IIS管理器,右键点击网站,点击“属性”,然后选择“文件夹”,点击高级,在高级属性中勾选“拒绝请求标头中指定的 User-Agents”,然后点击“编辑”,在左侧添加User-Agent,如“bot| crawl| spider| Yahoo| ia_archiver| other_spider| Googlebot”即可。 * IIS7:右键点击网站,点击“管理网站”,点击“自定义错误”,在错误页面中添加403.6错误,勾选“拒绝请求标头中指定的 User-Agents”,然后点击“编辑”,在左侧添加User-Agent,如“bot| crawl| spider| Yahoo| ia_archiver| other_spider| Googlebot”即可。

Public @ 2023-03-04 13:00:19

通过HTTP状态代码看搜索引擎怎么Crawl你的站

通过HTTP状态代码通通透透看搜索引擎怎么Crawl你的站。下面的表格是所有 HTTP 状态代码及其定义。代码指示2xx成功200正常;请求已完成。201正常;紧接 POST 命令。202正常;已接受用于处理,但处理尚未完成。203正常;部分信息 — 返回的信息只是一部分。204正常;无响应 — 已接收请求,但不存在要回送的信息。3xx重定向301已移动 — 请求的数据具有新的位置且更改是永久的。

Public @ 2009-12-30 15:35:42

百度蜘蛛IP段,如何查看百度真实蜘蛛

不要看所谓的IP段,IP也不是一沉不变的,过去开头有220.181的 大家都知道,但是后面百度方面在不同的城市都建立了更多的服务器,总要有IP的增加,而IP段不可能一直是固定的那几个。所以单纯的以IP段来看,是非常不严谨的。那么如何查看呢?可以使用cmd命令: nslookup IP地址  的方式来进行查看,如果返回的信息中,有百度子域名,那么说明是百度的IP,如果无法返回,或者返回了诸

Public @ 2009-12-15 16:22:30

更多您感兴趣的搜索

0.529537s