Categories


Tags


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-01-01 15:22:05

网站防止CC攻击的方法

1. 网络流量监测:检测大量的相同流量请求,并限制其访问频率。 2. IP黑名单:创建黑名单,自动封锁频繁访问的IP地址。 3. 人机验证:通过添加图形验证码或人机验证,防止机器自动攻击。 4. 限制连接速度:限制同一IP地址的连接速度,用于减缓强化攻击者的攻击速度。 5. 网络隔离:检测访问IP来源是否合法,对非法IP进行网络隔离,以避免流量攻击。 6. 防火墙:安装防火墙,规范网络访

Public @ 2023-04-24 04:50:13

网站全站启用HTTPS要如何配置?

为了全站启用HTTPS,需要进行以下配置: 1. 获取SSL证书:从CA机构(认证机构)申请SSL证书。 2. 配置Web服务器:在Web服务器上安装SSL证书,并设置HTTPS监听端口和协议。 3. 配置网站:将网站的URL地址修改为HTTPS,并将页面中的所有资源(CSS、JS、图片等)的URL地址也修改为HTTPS。 4. 强制跳转:使用301重定向,把所有的HTTP请求自动转发到H

Public @ 2023-06-03 02:00:13

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

《院长帮帮忙》栏目开始运营以后受到了广大站长欢迎,院长每天都会收到各种问题求助。为了更多站长获得收益,我们从中选取了最具有代表性的问题展现给大家。项目背景:和讯网参加星火计划2.0内测,按照站长平台主动提交技术说明代码,共提交两次,均返回报错。下面我们分享下整个case的排查过程:一、提交执行过程首先,按照链接主动提交的技术标准进行提交,具体内容参照《主动链接提交》。1、第一次提交代码curl -

Public @ 2017-05-18 15:22:02

【院长帮帮忙】移动适配不稳定、不生效,可能是这些原因造成的!(第五期)

1. 未设置Viewport Viewport是指浏览器中用于控制页面布局和缩放比例的元标签,如果未设置Viewport,则移动端浏览器会将页面按照PC端浏览器默认的布局来显示,导致页面排版错乱。因此,需要在head部分加入Viewport的设置,例如: ```html ``` 2. 媒体查询错误 在进行移动适配时,我们通常会使用媒体查询来针对不同设备进行样式的调整。但是,如果媒体查询的

Public @ 2023-04-04 12:50:29

更多您感兴趣的搜索

0.465718s