Categories


Tags


【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取(第一期)

在【院长帮帮忙】栏目露过面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2015-07-21 15:22:04

sogou spider 会封锁那些网站?

作为一款搜索引擎,sogou spider通常不会封锁任何网站。它的任务是遍历互联网并收集网站信息,然后将其添加到sogou搜索结果中。然而,如果一个网站包含有害的内容或违反了法律法规,sogou和其他搜索引擎可能会将其从搜索结果中删除,但这不属于sogou spider的工作范畴。

Public @ 2023-04-26 11:00:09

【院长帮帮忙】URL构成越简单越平常越好(第三期)

SEO不是事后工作,在站点在建设之初就要考虑到如何对搜索引擎友好。在院长看来,与其出手阔绰、花大价钱买个域名,不如找个经验丰富的SEO人员在站点结构等基础工作上多下工夫——这期院长帮帮忙,说的正是一个大家容易忽略的细节问题:url构成。先说结论吧:url构成(或者叫url规则)越简单越平常,百度处理起来越顺畅,越容易正确生效。院长收到的case是这样的,站长反应:跳转适配的PC页和移动页,内容可以

Public @ 2020-11-27 15:22:07

【院长帮帮忙】我的网站排名为什么突然下降?(第十期)

可能有多种原因导致您网站排名突然下降,以下是一些可能的原因及解决方法: 1. 竞争对手优化反击:您的竞争对手执行了更好的搜索引擎优化策略,导致他们的网站排名上升,您的网站排名下降。 解决方法:通过了解您的竞争对手的优化策略,制定更好的策略,例如添加更好的关键词、更好的网站内容以及实施更专业的SEO技巧。 2. 网站内容更新不及时或质量下降:搜索引擎对网站内容有一定的要求,如果您的网站缺乏新的

Public @ 2023-06-03 06:00:25

更多您感兴趣的搜索

0.429941s