Categories


Tags


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-01-01 15:22:05

网站全站启用HTTPS要如何配置?

百度站长平台目前是建议HTTP的网站将协议改造成HTTPS协议,百度搜索引擎也会优先收录HTTPS的网站。主要HTTPS是建立一个信息安全通道,具有加密传输有效保障了用户隐私数据密文传输,截取后也是无法解密。网站全站启用HTTPS要如何配置?一、HTTPS配置问:为什么站点有的链接是以HTTP的形式来抓取?为什么全站不能以HTTPS的形式来抓取?答:以前的机制是URL级,HTTPS是抓取完一条后再

Public @ 2016-01-28 15:56:11

网站安全维护技巧分析,如何不被黑呢?

要确保网站的安全性,需要采取以下维护技巧: 1. 使用强密码:使用复杂的密码,包含字母,数字和特殊字符,并定期更改密码。不要使用易于猜测的密码,如生日,电话号码等。 2. 更新软件和插件:定期更新网站使用的软件和插件,以修正已知漏洞和增强安全性。 3. 加密通信:使用HTTPS协议加密网站和用户之间的通信,以防止敏感数据被窃取。 4. 防止SQL注入攻击:应该使用预处理语句和数据过滤来防止

Public @ 2023-04-18 19:50:41

【院长帮帮忙】我的网站排名为什么突然下降?(第十期)

可能有多种原因导致您网站排名突然下降,以下是一些可能的原因及解决方法: 1. 竞争对手优化反击:您的竞争对手执行了更好的搜索引擎优化策略,导致他们的网站排名上升,您的网站排名下降。 解决方法:通过了解您的竞争对手的优化策略,制定更好的策略,例如添加更好的关键词、更好的网站内容以及实施更专业的SEO技巧。 2. 网站内容更新不及时或质量下降:搜索引擎对网站内容有一定的要求,如果您的网站缺乏新的

Public @ 2023-06-03 06:00:25

【院长帮帮忙】资讯页不收录,原来是抢发惹的祸(第四期)

里约奥运会结束了,资讯站点的小编们终于可以松口气了,可有些SEOer却高兴不起来:编辑辛苦抢先制作的原创稿件,百度却不!收!录!院长奥运会期间接到了四五起这样的反馈,经追查,原来是站点的抢发行为不够友好,导致spider抓取失败。结论:1,页面制作完成后再放到spider可以发现的地方,这样才能达到最好的抓取效果。2,页面未对外公开之前,千万不要通过工具推送给百度呀。接到站长反馈后,院长联系了sp

Public @ 2009-06-13 15:22:04

更多您感兴趣的搜索

0.462461s