Categories


Tags


关于URL组成部分的指南

原文地址:Talk like a Googler: parts of a url

作者:Matt Cutts   Google反垃圾网站组的带头人

让我们来解剖一个 URL 的所有部分。我将告诉你,在 Google 通常所涉及的分别指 URl 的哪些不同部分 。这是一个有效的 URL,并包含很多元素:

http://video.google.co.uk:80/videoplay?docid=-7246927612831078230&hl=en#00h02m30s

以上 URL 的组成元素分解:

传输协议是:http,类似的协议还包含:https,ftp, etc。

主机或主机名:video.google.co.uk 。

子域名是:video。

域名是:google.co.uk。

顶级域名(TLD)是:uk。uk 指的是国家顶级域名(ccTLD)。比如:google.com 其中顶级域名是 com。

二级域名(SLD)是:com.uk。

端口:80,这是 web 服务器的默认端口。其他的端口也是允许的,比如:web 服务器还可以听端口8000。当端口是80 时,很多人放空不写。

路径:/videoplay。路径通常指一个文件或 web 服务器上的一个位置。如:/directory/file.html 。

以上 URL 包含参数。参数名字是 docid,参数的值是-7246927612831078230。URLs 可以有很多参数。参数以问号(?)开始,以(&)隔开。

看到了“#00h02m30s”了吗?这称为一个字符串或一个命名锚链。字符串过去通常指网页文件中的一个内部片段。在这个例子中,这个命名锚链的意思是“2分30秒后跳转到视频”。我现在想起来,Google 通过移除字符串以实现 URL 标准化。

什么是静态 URL 或动态 URL?技术上,我们认为静态 URL 指的是服务器返回一个页面时不需要进行任何数据库操作。动态 URL 指,在返回页面之前,服务器需要进行相应的运算。

一些人通过问一个问题来简单区别静态 URL和动态 URL:“这个URL 中有没有问号(?)”。如果有问号,则一般认为是动态 URL;相反,则一般是静态 URL。当然,这不是一个硬性而有效的规则。比如,http://www.seowhy.com/26_87_zh.html  (译者按) 这个URL 看起来像是静态的,但它却需要 web服务器来处理。

来源:搜外网


Public @ 2021-08-06 16:11:12

内部链接nofollow控制权重分布

Nofollow属性推出以后,Matt Cutts多次说过,nofollow既可以用在论坛,博客等的留言中,代表这些链接不是站长能控制和背书的,也可以用在某些内部链接,以达到控制内部链接权重和PR流动及分布的目的。最常见的应用是在网站联系我们,隐私权政策,用户条款等链接上。这些网页往往都是整站有链接,如果没有使用nofollow,整站的链接权重都会平等的流动到这些网页上。而像隐私权政策这些网页一般

Public @ 2017-01-19 16:08:47

404页面是什么?

404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。据说在第三次科技革命之前,互联网的形态就是一个大型的中央数据库,这个数据库就设置在404房间里面。那时候所有的请求都是由人工手动完成的,如果在数据库中没有找到请求者所需要的文件,或者由于请求者写错了文件编号,用户就会得到一个返回信息:room 404 : file not found。404错误信

Public @ 2014-05-13 16:11:01

url上使用#号好不好

一般来说,url当中的#号是一个锚点的标志位,这样的url打开之后会将访问者的视线定位在指定位置上,令访问者直接看到网页中间的一段内容。自从推特流行开始,#号被附予了新的意义——话题。很多站长直接在#号后面加参数且参数是有效的,即#号去掉与不去掉,打开的网页完全不同。目前百度对带#号URL的收录策略是:去掉#号后面的内容,仅对#号前面的url进行建库。这样就导致一些站长认为有意义有价值的页面,百度

Public @ 2014-09-14 16:11:09

更多您感兴趣的搜索

0.461575s