HTTP状况码
当效劳器收到某项恳求时,例如,用户经过阅览器拜访你的网页,效劳器会向这个阅览器回来一个代码以呼应恳求,一个代码就称为:HTTP状况码,相同道理,当查找引擎的Robot(机器人)或Crawler(匍匐器)抓取你的网页时,效劳器也会回来HTTP状况码相应恳求。
此HTTP状况码供给关于恳求状况的信息,通知拜访的阅览器、查找引擎机器人:baiduspider、Googlebot等关于你的网站和恳求的网页的信息。
查找引擎数据库中心记载的页面内容复制,查找引擎在成果中给出“网页快照”(或其他类似称号)链接后,用户点击后看到的就是查找引擎数据库中的页面内容,用户由于某种原因不能拜访原始网页时,可以检查网页快照里的内容作为参阅(依照人和依照查找引擎蜘蛛程序)以及他们所拜访的网页数量
付费列表是指对于特定的搜索或分类目录,企业可以付费以获得更高的展示位置或更显著的展示方式。这种广告模式被称为付费上榜(paid inclusion)或付费点击(pay-per-click,PPC)。 在付费列表广告模式中,企业可以在搜索引擎的结果页面中显示自己的广告,在相关关键词中为自己的网站获得更高的排名。这种广告模式依靠竞价,即企业可以出价以获得更有效的点击率。 一些大型的搜索引擎和目录网
通过HTTP状态代码通通透透看搜索引擎怎么Crawl你的站。下面的表格是所有 HTTP 状态代码及其定义。代码指示2xx成功200正常;请求已完成。201正常;紧接 POST 命令。202正常;已接受用于处理,但处理尚未完成。203正常;部分信息 — 返回的信息只是一部分。204正常;无响应 — 已接收请求,但不存在要回送的信息。3xx重定向301已移动 — 请求的数据具有新的位置且更改是永久的。
我认为503状态码最大的作用是告知搜索引擎:现在服务器压力过大,网站(某个网页)稍后再抓取,503是指目前无法使用服务器(由于超载或进行停机维护)。通常,这只是一种暂时的状态。按照百度的说法,网站关闭或其他临时情况,这个时候网站应该返回:“503 Service Temporarily Unavailable”!使用503状态码,而不是404错误页面。如果网站需要临时维护或者未建立好就上线的页面,