利用百度蜘蛛referer找到报错页面入口_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

利用百度蜘蛛referer找到报错页面入口

大家应该都知道百度已经全站https并取消referer关键词显示了，那么“百度蜘蛛referer”又是什么？有什么妙用吗？艺龙SEO负责人刘明发现通过百度蜘蛛referer可以快速定位部分站内url的报错（4xx或者5xx）原因。随后社区版主飞鹰正义也对文章做了补充修正，现推荐给各位同学们。

什么是百度蜘蛛的referer

百度蜘蛛的referer，是指当百度蜘蛛抓取某一个URL的时候，在HTTP头中带的Referer字段。请注意，这个定义和百度最近声明去除Referer中关键词数据没有任何关系。这次讲的是spider发起的HTTP请求，百度而去除的是用户发起的。如果百度蜘蛛抓取百度首页的logo，会发起这样的请求：

上面Referer字段很明确的表示了他是从www.baidu.com这个页面上发现并抓取了www.baidu.com/img/bd_logo1.png。而大家在服务器访问日志中也应该能看到相应的记录。目前发现只有当百度抓取一个网页的同时，又抓取了网页中的：img、js和css才会带上referer字段。这部分额外的抓取量，应该不会占用百度分配的抓取配额，属于“买1送1”。

对于站长的意义

如果你发现有一批URL（仅限于img,js,css）报错（4xx或者5xx），但是一直找不到入口在哪，也就是说你不明白百度蜘蛛是从哪里发现这些错误URL的。这个字段可以帮助你迅速定位。

举个例子

比如我们的SEO日志分析系统中可以看到，符合下面这种URL Pattern的路径每天有6万到10万的抓取而且全部报404。

从发现问题至今过了1个月，查遍整个网站我也没找到入口。今天偶然仔细查了一下日志，想起了百度蜘蛛的referer，马上就能定位问题了。这些404的URL来自于一套没人维护也没人关注的页面（往往是这样）。收录流量都不错。由于最近公司图片系统更新，图片的URL全部更改了，但这套页面并没有跟着更新。

如果站点没有记录referer怎么办

iis请在这里勾选“cs(Referer)”：

apache请参考:

apache log配置“Combined Log Format”章节

apache log配置的官方链接

Nginx请参考：

nginx log配置

nginx log配置的官方链接

结束语

· 很多SEO问题并不是立即致命的，所以没有及时解决。流量就像蚂蚁啃大象一样一点一点啃掉了。

· 系统性的知识积累还是会在关键时刻发挥作用的。

· 感谢飞鹰对本文的修正。

至此文章虽然结束但是讨论可以继续，大家可以到[学堂同学汇] 《利用百度蜘蛛referer找到报错页面入口》讨论帖，与作者刘明进行探讨。

来源：百度搜索资源平台百度搜索学堂

Public @ 2012-04-14 15:38:46

大型网站的 HTTPS 实践（4）：协议层以外的实践

除了在协议层实践 HTTPS 的安全性外，大型网站还需要在其他方面做好安全措施。 1. 认证授权认证和授权是保障网站安全性的基础，应该采用安全可靠的方式来进行身份认证和权限授权。网站需要建立良好的认证与授权体系，严格限制敏感操作的权限，确保只有授权用户才能访问和操作资源。 2. 安全开发安全性可以从软件开发周期的起始阶段开始考虑。采用安全开发的方法，包括进行安全需求分析、安全设计、安全

Public @ 2023-04-27 12:50:23

里约奥运会结束了，资讯站点的小编们终于可以松口气了，可有些SEOer却高兴不起来：编辑辛苦抢先制作的原创稿件，百度却不！收！录！院长奥运会期间接到了四五起这样的反馈，经追查，原来是站点的抢发行为不够友好，导致spider抓取失败。结论：1，页面制作完成后再放到spider可以发现的地方，这样才能达到最好的抓取效果。2，页面未对外公开之前，千万不要通过工具推送给百度呀。接到站长反馈后，院长联系了sp

Public @ 2009-06-13 15:22:04

【官方说法】只需两步，正确识别百度蜘蛛（User-Agent）

威海Spider 威海Baiduspider
1140

步骤一：查看 User-Agent 信息在你的网站后台查看日志或者使用网站统计工具，可以查到每次访问你网站的 User-Agent 信息。百度蜘蛛的 User-Agent 格式如下： Baiduspider/数字（+版本信息）例如：Baiduspider/2.0、Baiduspider/2.0b等。步骤二：验证 IP 地址验证访问你网站的 IP 是否是百度蜘蛛的 IP。可以在百度

Public @ 2023-04-11 07:50:16

百度Spider渲染UA在移动端全流量上线

威海Spider 威海Baiduspider
1363

百度Spider在2017年3月同时推出渲染UA在移动端和PC端进行内测（《百度Spider新增渲染UA抓取公告》），内测期间分析了多个抓取量异常的case，均非渲染UA造成。本周百度Spider渲染UA在移动端全流量上线，PC端还未全部覆盖。特提醒PC站长，截止目前，对搜索引擎和用户有价值的内容，还是尽量不要使用JS加载的方式，以免造成不能索引等损失。来源：百度搜索资源平台

Public @ 2014-04-27 15:38:47

Categories

Tags