Categories


Tags


apache、iis6、ii7独立ip主机屏蔽拦截蜘蛛抓取(适用vps云主机服务器)

  apache、iis6、ii7独立ip主机屏蔽拦截蜘蛛抓取(适用vps云主机服务器)

整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容及代码片段有且仅有借鉴意义。

  在VPS云主机服务器上,可以通过以下方式屏蔽拦截蜘蛛抓取:

1. Apache服务器:

在Apache配置文件(httpd.conf或apache2.conf)中添加以下代码:

```
SetEnvIfNoCase User-Agent ".*((Googlebot)|(Baiduspider)|(Yahoo! Slurp)|(bingbot)|(YandexBot)).*" bad_bot

Order Allow,Deny
Allow from all
Deny from env=bad_bot
```

这段代码的作用是对于User-Agent中包含Googlebot、Baiduspider、Yahoo! Slurp、bingbot、YandexBot的蜘蛛,禁止访问网站内容。

2. IIS6服务器:

在IIS6中,可以通过ISAPI筛选器的方式进行屏蔽拦截。具体操作方法如下:

(1) 打开IIS管理器,选中要设置ISAPI筛选器的站点。

(2) 右键单击该站点,选择“属性”选项,在“本地站点”选项卡中找到“编辑属性”按钮。

(3) 在“ISAPI筛选器”选项卡中找到“添加”按钮,添加ISAPI筛选器“UrlScan”(或其他第三方筛选器)。

(4) 在“UrlScan.ini”(或其他筛选器的配置文件)中,添加以下代码:

```
[DenyHeaders]
User-Agent: Googlebot
User-Agent: Baiduspider
User-Agent: Yahoo! Slurp
User-Agent: bingbot
User-Agent: YandexBot
```

这段代码的作用是对于User-Agent中包含Googlebot、Baiduspider、Yahoo! Slurp、bingbot、YandexBot的蜘蛛,禁止访问网站内容。

3. IIS7服务器:

在IIS7中,可以通过动态IP限制功能进行屏蔽拦截。具体操作方法如下:

(1) 打开IIS管理器,选中要设置IP限制的站点。

(2) 在“配置”选项卡中找到“IP限制”功能,配置“动态IP限制”。

(3) 在“动态IP限制设置”中找到“添加/编辑限制”按钮,添加以下IP地址:

```
66.249.64.0/19
180.76.0.0/16
202.108.0.0/16
157.55.0.0/16
```

这些IP地址代表Googlebot、Baiduspider、Yahoo! Slurp、bingbot等蜘蛛的IP地址段,通过限制这些IP地址,可以禁止访问网站内容。

Public @ 2023-06-20 14:00:02 整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容有且仅有借鉴意义。

如何判断是否冒充Baiduspider的抓取?

建议您使用DNS反向查找和DNS正向查找相结合的方式来确定抓取来源的ip是否属于百度,根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:    6.1 在linux平台下:(1)使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.b

Public @ 2021-10-08 15:56:48

Baiduspider抓取造成的带宽堵塞?

Baiduspider的正常抓取并不会造成您网站的带宽堵塞,造成此现象可能是由于有人冒充Baiduspider恶意抓取。如果您发现有名为Baiduspider的agent抓取并且造成带宽堵塞,请尽快和我们联系。您可以将信息反馈至 投诉平台 ,如果能够提供您网站该时段的访问日志将更加有利于我们的分析。

Public @ 2022-11-07 15:56:46

哪些网站垃圾蜘蛛可以屏蔽?屏蔽无流量搜索引擎抓取

网站做的越大,蜘蛛越多。可是有时候会发现:网站被各种搜索引擎的蜘蛛抓的服务器都快崩溃了,严重的占用了服务器的资源。这个时候要怎么办呢?百度蜘蛛:Baiduspider谷歌蜘蛛:Googlebot360蜘蛛:360SpiderSOSO蜘蛛:Sosospider神马蜘蛛:YisouSpider微软必应: BingBot在国内,我们不要把这几个蜘蛛使用robots.txt屏蔽就可以了,至于其他的,都可以

Public @ 2020-10-09 16:22:29

apache、iis6、ii7独立ip主机屏蔽拦截蜘蛛抓取(适用vps云主机服务器)

在VPS云主机服务器上,可以通过以下方式屏蔽拦截蜘蛛抓取: 1. Apache服务器: 在Apache配置文件(httpd.conf或apache2.conf)中添加以下代码: ``` SetEnvIfNoCase User-Agent ".*((Googlebot)|(Baiduspider)|(Yahoo! Slurp)|(bingbot)|(YandexBot)).*" bad_bot

Public @ 2023-06-20 14:00:28

更多您感兴趣的搜索

0.473085s