Categories


Tags


canonical标签的作用和使用方法

canonical标签是页面html代码head部分的一个标签,2009年2月由搜索引擎们推出,主要用于解决网址规范化问题。

什么是网址规范化问题?

网址规范化一直是困扰站长以及搜索引擎的一个问题。据估计,网上有10%-30%的URL是内容相同但URL不一样的不规范化网址。

这就造成几个问题。比如:

对站长来说,多个URL存在分散了页面权重,不利于排名。

对搜索引擎来说,浪费资源,浪费带宽。

搜索引擎发现多个网址内容相同时,不会惩罚,而会尽可能找出那个应该是规范化的网址。但程序毕竟只是程序,可能出错,挑出来的可能不是站长想要的那个规范化网址。

网站上网址规范化问题太严重的话,也可能影响收录。一个权重不很高的域名,能收录的总页面数字是有限的。搜索引擎把资源花在收录不规范的网址上,留下给真正不同内容的资源就减少了。

要解决URL规范化问题也有很多选项,比如:

使用301转向,把不规范化URL全部转向到规范化URL

确保使用的CMS系统只产生规范化网址

确保网站上所有站内链接都指向规范化网址

外部链接尽量指向规范化网址

在提交给搜索引擎的sitemap.xml网站地图中只提交规范化网址

英文网站的话,在Google管理员工具中设置首选域

但这些方法都各有局限。

有的网站因为某种原因做不了301转向

CMS系统大部分情况下不受自己控制

内部链接自己可以控制,但其他人链接到自己网站上就不受控制了

总之,虽然有解决方法备选,但网址规范化到目前为止还是个不小的问题。

Canonical标签的使用方法

2009年2月,Google,雅虎,微软共同发布了一个新的标签canonical tag,用于解决网址规范化问题。刚开始推出时百度没参与。但大约2013年时百度也明确支持canonical标签。

简单说,就是在HTML文件的头部加上这样一段代码:

<link rel=”canonical” href=”http://www.example.com/product.php?item=swedish-fish” />

意义就是这个网页的规范化网址应该是:

http://www.example.com/product.php?item=swedish-fish

下面这些URL都可以加上这段代码:

http://www.example.com/product.php?item=swedish-fish&category=gummy-candy

http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

这些URL的真正规范化网址就都成为:

http://www.example.com/product.php?item=swedish-fish

简单说,这个标签相当是一个页面内的301转向。区别在于用户并不被转向,还是停留在不变网址上,而搜索引擎会把它当作是301转向处理,也就是说把页面链接的权重都集中到代码中指明的规范化网址上。

Canonical标签的一个优点是方便,可以直接写在页面html代码中,不用服务器端设置转向之类。某些情况下,部分站长可能无法设置转向,但html代码总是能控制的。

Canonical标签的作用和细节

另外有几个细节站长需要注意:

这个标签只是一种建议或暗示,而不是指令,它不像robots文件那样是个指令。所以搜索引擎会很大程度上考虑这个代码,但并不是百分之百,还会考虑其他情况来判断规范化网址。这也防止站长有可能把网址弄错。

这段代码既可以使用绝对地址,也可以使用相对地址。通常还是建议使用绝对地址比较保险。

指定的规范化网址上的内容,与其他使用这段代码的非规范化网址内容可以有一些不同,不一定完全一样。比如在电子商务网站上有很多按价钱、颜色,、尺寸升降排序,生成的URL全都不一样,但内容大体相同,只有细小区别,就可以使用这个标签。

搜索引擎会把带有同样canonical标签的页面权重集中到标签指向的那一个页面上。

指定的规范化网址可以是不存在页面,返回404,也可以是还没有被收录的页面。但是不建议这么做,别没事找事。

这个标签适用于同一个域名内,包括二级域名。也可以跨域名使用。所以可以在其它网站发布文章时加上。当然,这个在国内基本不现实。

别把这个标签当救命草,首先还是得把网站结构做好,尽量避免出现URL规范化问题。这只是最后万不得已的方法。

敏感的人大概能从这个新标准里看到建立大量外部链接的机会。

来源:SEO每天一贴 Zac 昝辉


Public @ 2013-03-13 16:11:17

robots.txt文件放在哪里?

robots.txt文件放在哪里?robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如 http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果 Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。网站 URL相应的 robots.txt的 URLhtt

Public @ 2017-01-09 16:08:57

什么是死链&;死链的标准

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。目前内容死链召回存在召回率的风险,所以建议各位站长尽量使用协议死链,以保证平台工具更好地发挥其作用

Public @ 2011-08-11 15:36:58

能否利用canonical标签陷害竞争对手?

今天再介绍一个黑帽负面SEO的想法:利用canonical标签陷害竞争对手。聊黑帽SEO绝不是建议读者做黑帽,优化正规网站的还是尽量别尝试,风险很大。但了解黑帽SEO方法,一是开拓思路,第二更重要的是,防范别人用负面SEO方法陷害自己。站长们认真观察的话一定会发现,负面SEO的尝试是一直在发生的。我这个小小的、谁也不得罪的SEO博客都经常被人制造巨量垃圾链接、制造大量敏感词搜索页面、刷跳出率等等,

Public @ 2019-01-30 16:11:18

再谈Canonical标签

前几天站长社区有站长朋友谈了一下对Canonical标签的看法,认为这是一个与301类似、解决网站内重复页面的好办法。那么我们来谈谈这两者有什么区别,使用Canonical标签时又该注意些什么。【Canonical标签与301的区别】1,在几个网页内容完全相同(或高度相似)的时候,如果希望两个网页都可以被用户正常访问到,就使用Canonical标签;如果仅让用户访问其中的一个,直接使用301跳转更

Public @ 2015-05-27 16:11:17

更多您感兴趣的搜索

0.138362s