Google的奇怪规则：URL不能以.0结尾_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

Google的奇怪规则：URL不能以.0结尾

威海seo专题威海网站收录
1508

前两天SEOMoz发现和解决了一个很奇怪的Google收录问题。

SEOMoz有一个网页，是关于他们举办的Web 2.0大奖（Web 2.0 Awards）。URL是：

http://www.seomoz.org/web2.0

这个奖在网上还挺受欢迎，链接很多，URL是PR7。而且一直以来在Google搜索”Web 2.0 Award”时都排在第一位。

但前几天SEOMoz发现搜索Web 2.0 Award时，这个页面从Google消失了。排在最前面的是一个更深一层的页面。

SEOMoz也弄不清是这么回事。所以Rand联系了Google里面认识的人，Google的人建议最好把URL改成不以.0结尾。

注意看SEOMoz这个页面URL，后面没有跟着一个斜线/。在大部分情况下，URL结尾没有典型文件扩展名如.html，.php等时，URL会被当作目录，目录名后面没有斜线时，服务器会在后面自动加上一个斜线。比如SEO每天一贴，如果用户直接打开：

https://www.seozac.com/

或者有其他网页链接到上面这个URL，服务器都会自动做一个301转向到：

https://www.seozac.com/

由于某种原因，SEOMoz的这个URL并没有做301转向自动在目录后加上斜线，也就是说URL还是以.0结尾：

http://www.seomoz.org/web2.0

浏览器和蜘蛛就把这个URL当作了文件名，这个文件的扩展名（或者说文件类型）是.0。而.0文件Google拒绝收录，就像.exe文件一样。

SEOMoz做了很多调查，发现页面没被收录问题确实是因为这个以.0结尾的URL。在网上找不到以.0结尾的文件被收录在Google数据库中。像以下这些文件在Google都没收录，但雅虎有收录：

en.wikipedia.org/wiki/Windows_1.0

en.wikipedia.org/wiki/Web_2.0

http://en.wikipedia.org/wiki/Die_Hard_4.0

drupal.org/drupal-5.0

keznews.com/3799_Vista_Transformation_Pack_8.0_Final_-_VTP_8.0

en.wikipedia.org/wiki/BASIC_8.0

drupal.org/drupal-6.0

en.opensuse.org/OpenSUSE_11.0

www.shopping.com/xGS-Illustrator_11.0

www.mythtv.org/wiki/index.php/Opensuse_11.0

www.shopping.com/xGS-Suse_9.0

en.wikipedia.org/wiki/Mac_OS_X_10.0

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0

而非常相似的下面这些URL，Google就有收录：

en.wikipedia.org/wiki/Web_2

drupal.org/drupal-5.0-beta1

http://keznews.com/3799_Vista_Transformation_Pack_8_0_Final_-_VTP_8_0

drupal.org/drupal-6.0-beta1

www.mythtv.org/wiki/index.php/Opensuse_10.3

www.mythtv.org/wiki/index.php/Opensuse_10.2

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3

比较一下这两个URL，域名，链接深度等几乎都没什么区别，唯一的区别就是URL结尾的不同：

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3 收录

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0 没收录

SEOMoz发现了这个问题后，发了一篇帖子。很快Matt Cutts也回了篇帖子，做出了回复和调整。Matt Cutts说，是因为连到URL

http://www.seomoz.org/web2.0

的链接足够多时使Google认为它是应该被收录的那个URL版本，但Google又不收录.0文件，所以SEOMoz的这个页面被删除了。

Matt Cutts还提到一个小技巧，要检查某种文件名是否会被Google中被收录，有一个很简单的指令如：

filetype:exe

上面的搜索结果可以看到，没有直接以.exe结尾的URL被收录，也就是说.exe文件Google不收录。

同样.0文件Google一直到两天前还都不收录。不过Matt Cutts看到SEOMoz的这个帖子后，与工程师重新审视了一下现在以.0结束的URL，肯定也不都是垃圾页面（可能以前大部分是），所以对Google收录算法做了一定调整，重新开始收录.0文件。其实很多网页以.0结束，并不是因为文件类型，而是像SEOMoz那样，在想写Web2.0时，很巧合的以.0结尾而已。

现在搜索一下的话，已经可以看到SEOMoz的这个Web2.0奖网页已经重新被收录了：

第一，这种细节问题，不碰到还真想象不到。

第二，认识人好办事。

第三，Google经常也从善如流。

来源：seo每天一贴 Zac 昝辉

Public @ 2013-10-31 15:34:40

感谢爆老师的分享：seo元素周期表早在2011年的时候就有首发出来，这节课件里的周期表是2013年版由search engine land更新过的版本，主要是加入了一些社会化媒体的影响元素到里面。爆老师这节课会对在图标中的每一个元素块进行讲解。首先我们要搞清楚怎么看这个周期表，它其实就是化学元素周期表的临摹，用可视化设计表现出seo元素对于整个算法体系的重要性。当然是把部分元素搬了上来，并不是所有

Public @ 2010-01-31 15:52:08

关于网站删除页面对SEO的影响，说下谷歌的一些态度

威海seo专题威海seo
2119

删除不良页面是否对SEO有所帮助？大多数人会有这样的观点：消除网站“死角”将帮助Google专注于重要的页面。简而言之，就是删除一些页面之后，我们在站点地图中向Google提交的页面就会变得更少，而Google可以更好地专注于网站的重要页面。对此，谷歌的 John Mueller 回答说：删除页面可能会让其余页面的性能变差，更少的页面也不利于更高的排名。盲目删除页面甚至会对您的SEO效果产生负面影

Public @ 2013-07-27 16:18:32

百度不收录原因分析——spider抓取篇

威海Spider 威海网站收录
1090

目前百度spider抓取新链接的途径有两个，一是主动出击发现抓取，二就是从搜索资源平台的链接提交工具中获取数据，其中通过主动推送功能“收”上来的数据最受百度spider的欢迎。对于站长来说，如果链接很长时间不被收录，建议尝试使用主动推送功能，尤其是新网站，主动推送首页数据，有利于内页数据的抓取。那么同学们要问了，为什么我提交了数据还是迟迟在线上看不到展现呢？那涉及的因素可就多了，在spider抓取

Public @ 2022-03-19 15:34:34

网站不收录怎么办，这几个自测是否没做过?

威海seo专题威海网站收录
2677

如果您的网站没有被搜索引擎收录，可以尝试以下方法进行处理： 1. 检查 robots.txt 文件：确保您的网站没有被该文件禁止收录。您可以在网站根目录的robots.txt文件中查看并编辑。确保没有设置了类似"Disallow: /"的指令，这会禁止搜索引擎收录您的整个网站。 2. 提交网站站点地图：创建一个XML网站地图，并通过Google Search Console或其他搜索引擎的We

Public @ 2023-07-30 22:50:35

Categories

Tags