Categories


Tags


如何正确识别Baiduspider移动ua

百度站长平台发布公告宣布新版Baiduspider移动ua上线,同时公布了PC版Baiduspider UA,那么该如何正确识别移动UA呢?我们百度站长平台技术专家孙权老师给出了答案:

新版移动UA:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

之前通过“+http://www.baidu.com/search/spider.html”进行识别的网站请注意!您需要修改识别方式,新的正确的识别Baiduspider移动ua的方法如下:

1. 通过关键词“Android”或者“Mobile”来进行识别,判断为移动访问或者抓取。

2. 通过关键词“Baiduspider/2.0”,判断为百度爬虫。

另外需要强调的是,对于robots封禁,如果封禁的agent是Baiduspider,会对PC和移动同时生效。即,无论是PC还是移动Baiduspider,都不会对封禁对象进行抓取。之所以要强调这一点,是发现有些代码适配站点(同一个url,PC ua打开的时候是PC页,移动ua打开的时候是移动页),想通过设置robots的agent封禁达到只让移动Baiduspider抓取的目的,但由于PC和移动Baiduspider的agent都是Baiduspider,这种方法是非常不可取的。

更多相关问题讨论,欢迎移步【学堂同学汇】《如何正确识别Baiduspider移动ua》讨论帖

来源:百度搜索资源平台 百度搜索学堂


Public @ 2010-04-10 15:38:45

网络爬虫(Spider)

网络爬虫(Spider)是一种自动化程序,用于通过互联网收集和抓取网页信息。它模拟人类在浏览器中的操作,自动访问网站并抓取其中的信息。爬虫的主要作用是帮助用户快速地获取海量数据,例如网页内容、图片、音频、视频等,并将它们存储在一个本地数据库中,以供后续处理和分析。在人工获取数据耗时费力的情况下,网络爬虫的应用可以大大提高数据抓取效率,以及提高数据处理的准确与可靠性。

Public @ 2023-06-02 04:00:09

什么是蜘蛛池?

网站关键词上海网站建设、网站建设两个都有,如果我先做简单的上海网站建设这样,上海网站建设的关键词密度我会注重提高,可是网站建设关键词的密度也会提高(上海网站建设包含了网站建设)这样子是不是就相当于是在做两个关键词?夫唯是的。所以,到时你权重高了后,那个难度大的词也会上去。烟火有的网站权重不高,但差不多秒收,是不是有什么作弊技巧在里面?我有听说过蜘蛛池什么的,不是特别懂?夫唯蜘蛛池简单说,是手上有很

Public @ 2022-11-04 16:22:31

BaiDuSpider百度蜘蛛占用流量,robots.txt设置

BaiDuSpider(百度蜘蛛)是百度搜索引擎的爬虫程序,它会访问网页并获取其中的信息,从而建立网站的索引和排名。由于百度蜘蛛需要频繁访问网站,因此它会占用网站的流量和带宽资源。 为了控制百度蜘蛛的访问,网站管理员可以使用robots.txt文件进行设置。robots.txt是一个文本文件,位于网站根目录下,用于告诉搜索引擎爬虫哪些页面可以访问,哪些页面不允许访问。具体来说,可以在robots

Public @ 2023-06-10 09:00:15

为什么我的网站已经加了robots.txt,还能在百度搜索出来?

因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过 投诉平台 反馈请求处理。

Public @ 2020-06-13 15:56:47

更多您感兴趣的搜索

0.483528s