Categories


Tags


Matt Cutts谈大爸爸数据中心,补充材料网页及收录网页数下降

在大爸爸数据中心更新结束后,很多站长发现被收录的网页数急剧下降。有时候能从几万页降到几页,而且补充材料网页越来越多。

很多人一直在问,为什么Matt Cutts对这个问题一直不做评论?今天Matt Cutts发了一个很长的帖子,一次性回答大爸爸更新之后的一些问题。帖子很长,下面拣要点翻译一下。

首先Matt Cutts给那些不想读这么长帖子的人两点小结。第一,Google的爬行和索引部门有足够的机器。收录网页数下降并不是因为Google没地方存了。第二,Google继续认真听取站长们的反馈。

大爸爸更新3月份已经结束

在12月爬行/索引部门已经准备好开始大爸爸更新。大爸爸指的是爬行和一部分索引软件的更新(这是第一次听说稍微具体点儿的关于大爸爸到底是什么的信息)。

1月上旬,Matt Cutts给出一个正在运行大爸爸数据中心的IP地址,要求站长们提供反馈。

2月份,大爸爸数据中心在更多数据中心使用。

3月份,很多站长开始投诉他们的网页没有被大爸爸收录,并且有越来越多的补充材料网页。

3月13 号,Google Guy (一位匿名Google员工)在站长世界论坛征求具体的例子。

在看了这些例子网站之后,我可以在几分钟之内,就看出问题在哪儿。这些在大爸爸数据中心里面有问题的网站,是那些我们的算法对这个网站的反向链接和导出链接的信任度都很低的网站。比如说大量交换链接,连向垃圾网站,买卖链接。

大爸爸和补充材料结果无关。所以当大爸爸不收录一个网站的网页的时候,补充引擎就可能收录更多的网页。

我和爬行/索引部门一起调节了算法的门槛,以收录更多这种网站。3月22号,我发了一个帖子,告诉大家我们正在收录更多的网页。

3月29号,大爸爸更新完全完成,旧系统关闭,从那之后所有的爬行都是由大爸爸控制的。

考虑到程序编码更新的数量,我觉得大爸爸更新是很成功的,只有两个投诉。第一个就是前面提到的,信任度比较低的网站的网页被爬行和收录的比较少,我们对此作出了反应,很快开始收录更多的网页。另一个投诉是Google Adsense爬行的网页开始出现在搜索结果中,实际上这是爬行缓存代理的设计。

关于大爸爸就这些了。大爸爸从12月份开始出现到3月份完全完成。在完成大爸爸之后,我们把注意力更多的转向了对补充材料结果的更新。下面将会谈到比较具体的时间表。在这同时,有一种说法是我们的机器都满了。从我个人的角度 看,我们当然有足够的机器来爬行和索引网页。

补充材料结果更新

4月初,我们开始向用户显示更新过的补充材料结果。

4月13 号,有人开始谈论被收录的网页减少了。

4月24号,Google Guy希望人们提供细节。

我看了这些反馈,并没有看出什么重要的规律。我把这些例子交给了爬行/索引部门,他们也没看出什么规律。网站地图部门也进行了研究,结论是和网站地图也没什么关系。负责补充材料结果更新的部门,检查了这些反馈意见。5月5号,他们发现使用”site:”指令(注:这个指令会列出所有被收录的网页),并不返回补充材料结果,他们在当天就解决了这个问题。后来他们又发现了site指令无法工作于由分字符链接的域名,很快也解决了。

Google Guy在5月8号希望站长们提供更多信息。

这些就是我所知道的补充材料结果的问题和已经解决了的问题。下面举一些具体的例子,看为什么有的网站被收录的网页数急剧减少。

一个.tv关于某一个国家房地产的网站。5月3号,这个网站的管理员说他的网站从两万页降到了300页。我看过以后,用”site:”指令已经可以返回31200页。所以这个域名应该没有问题了。

一个5月11号的例子,站长只提供了网址,没有其他文字和解释。这也是一个房地产网站,有387页被收录。但是在网页底部你可以看到这些链接到铃声下载,SEO比赛,鱼油网站等等,我想我找到了问题。如果你想让你的网站更多页被收录的话,你得多考虑你的链接的质量。对索引进行了修改以后,我们处理交换链接和买卖链接的能力都提高了。

再看一个5月4号的例子,又是一个房地产网站。站长说被收录的网页数从一万降到了80,我看了一下这个网站,这回看到的是链接向贷款按揭网站,信用卡网站,运动器械网站等。和上面的一样,如果你做很多交换链接,现在新的蜘蛛有不同的爬行优先考虑,你就不要奇怪了。

再看一个健康保养的目录网站,看起来是个不错的网站,也没链接向不好的网站,但是整个域名只有6个导入链接。这么少的导入链接,我想Google蜘蛛只能爬行比较少的网页。

总体上来说,我检查的几个网站在这几天都有了更多的被收录的网页。做很多交换链接的网站,可能发现爬行次数少了。如果你的导入链接太少,被爬行的也会比较少。

我的评论:看来大爸爸完成之后,Google确实减少了对很多网站的爬行和收录。原因主要在于链接的质量。做大量交换链接,买卖链接,链接向垃圾网站,链接向无关网站,受影响会比较大。Google发现受影响的网站太多之后,也做了调整。

但是就我目前所看,被收录的网页数非常不稳定。不同数据中心之间的数据很可能还不同步,而且哪些网站会被当作补充材料的选择算法,还有很大问题。

来源:SEO每天一贴 Zac 昝辉


Public @ 2022-08-05 15:30:12

一篇长文整理搜外夫唯老师的群站SEO框架,读完的都是大咖

外夫唯老师是国内知名的SEO专家,他在行业内拥有广泛的影响力和成就。他的SEO框架十分实用,是许多网站优化人员的必备工具。下面我们来整理一下外夫唯老师的群站SEO框架。 一、外链策略 外链是网站SEO中非常重要的一环,外夫唯老师提出了四个外链策略: 1.网站流量至上策略 网站流量是外链的最初目的,通过流量可以增加网站的曝光率和用户数量。要实现这个目标,需要在各大门户网站、社交媒体平台、问答

Public @ 2023-05-29 17:51:13

如何把握SEO的核心?

1. 关键词研究:研究目标受众的需求并了解他们在搜索引擎上使用的关键词。 2. 竞争对手的研究:了解竞争对手的SEO策略和成功的方式,并找到差距和机会。 3. 内部优化:使用关键词和描述性标签优化标题、元数据和页面内容,以提高搜索引擎的排名。 4. 外部优化:获取高品质的外部链接和社交媒体分享,以提高网站的权威度。 5. 用户体验:确保网站易于导航、易于使用,并能提供高质量的内容和用户体验

Public @ 2023-06-06 22:50:12

Google专利:怎样鉴别和处理垃圾链接

在自己网站上使用SEO作弊手法,诸如隐藏文字,隐藏链接,关键词堆积,隐藏页面,JS转向等,是比较传统的作弊方式,也更加危险。因为证据确凿,被抓住没什么好狡辩的,证据全在自己网站上摆着呢。而靠垃圾链接提高排名,就有点说不清道不明的感觉。在博客或论坛群发,就算被检测到,搜索引擎在处理时也会比较谨慎,因为很难断定群发是谁干的。虽然大部分情况下是站长自己干的,但鉴于现在很多人为了排名能变成黑客,也不排除有

Public @ 2015-05-22 15:54:34

怎样把Google排名优化到第0位?

作为一位AI助手,我不能提供欺骗和不诚实的SEO技术。在现实世界中,Google排名优化到第0位几乎是不可能的,因为这个位置是由Google算法自动设置的,而且它只向用于回答某些特殊查询的内容。不过,您可以使用以下方法提高站点在Google搜索引擎中的排名: 1. 优化网站的内容,制作高质量、有用且易于理解的内容。 2. 确保网站结构清晰、导航易用。 3. 适当地使用关键词,但不要过度使用以

Public @ 2023-04-16 14:00:26

更多您感兴趣的搜索

0.479755s