Categories


Tags


提交Sitemap

Sitemap(站点地图)是一种文件,站长可通过该文件列出网站上的网页,将网站内容的组织结构告知搜索引擎。

神马等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取网站内容

理想状况下,如果您的网站网页间关联得当,神马的网页抓取工具便能够发现其中的大多数网页。即便如此,提交站点地图仍有助于搜索引擎更加有效地抓取网站,尤其是当网站符合以下某个条件时:

1.网站为新建网站且指向该网站的外部链接不多。搜索引擎的网页抓取工具通过跟踪网页之间的链接来抓取网页,如果没有其他网站链接到您的网页,可能不会发现您的网页。

2.网站规模很大。 在这种情况下,神马的网页抓取工具可能会在抓取时漏掉部分新网页。

3.网站中大量内容页之间互不关联或缺少有效链接。 如果您的网站网页没有自然地相互引用,那么您可以在站点地图中列出这些网页,以确保搜索引擎不会漏掉您的网页。

需要注意的是,神马搜索会按正常流程分析、处理Sitemap,但不保证一定会抓取及索引您提交的所有网址,不保证其在搜索结果中的排名。

Sitemap格式:

神马搜索支持的Sitemap文件包括标准xml文件和索引型xml文件。标准xml文件最多包含10,000条url,如果url超过10,000条可采用索引型xml文件,索引型xml限定最多不超过三层。

标准xml文件格式示例:

<?xml version="1.0" encoding="utf-8"?>

<!-- XML文件需以utf-8编码-->

<urlset>

<!--必填-->

<url>

<!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->

<loc>http://m.domain.com/abc.xhtml</loc>

<!--必填,URL长度限制在256字节内-->

<lastmod>2014-05-01</lastmod>

<!--更新时间标签,非必填,用来表示最后更新时间-->

<changefreq>daily</changefreq>

<!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->

<priority>0.5</priority>

<!--优先级标签,优先级值0.0-1.0,用来告知引擎该条url的优先级-->

</url>

<url>

<loc>http://m.domain.com/123.xhtml</loc>

<lastmod>2014-05-01</lastmod>

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

</urlset>

索引xml文件格式示例:

1.顶层Sitemap格式

<sitemapindex>

<sitemap>

<loc>

http://www.abc.com/sitemap_v2/detail_new/index/index_1.xml

</loc>

<lastmod>2013-12-18 12:59:12</lastmod>

<!--更新时间标签,必填,用来表示xml文件最后更新时间-->

</sitemap>

</sitemapindex>

2.中间层Sitemap格式(非必要,视url数量而定)

<sitemapindex>

<sitemap>

<loc>

http://www.abc.com/sitemap_v2/detail_new/1/1.xml

</loc>

<lastmod>2013-12-18 12:59:12</lastmod>

</sitemap>

</sitemapindex>

3.内容层Sitemap格式

参照标准xml文件格式示例

来源:神马站长平台


Public @ 2022-11-08 16:09:48

什么是错误链接?

根本不存在的链接,就是错误链接。错误链接与死链接的区别:错误链接是由于用户的疏忽,请求的链接不存在。死链接是原来访问正常,后来因为网站的变故而不能访问。发生错误链接的情况:用户对域名拼写错误。URL地址书写错误。URL后缀多余了或缺少了斜杆。URL地址中出现的字母大小写不完全匹配。来源:搜外网

Public @ 2018-05-24 16:21:34

301永久重定向

301永久重定向是一种非常重要的“自动转向”技术,是网址重定向最为可行的一种办法。当用户或搜索引擎向网站服务器发出浏览请求时,服务器返回的HTTP数据流中头信息(header)中的状态码的一种,表示本网页永久性转移到另一个地址。301永久重定向:这是SEO中的一个基础名词,在URL规范化中会用到,也许大家都知道这个名词,但是由于应用的不是非常频繁,导致很多专业做SEO的朋友都不是很熟悉301永久重

Public @ 2013-02-22 16:09:41

百度Sitemap支持哪些格式

百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:1.第一种格式样例:txt文本格式在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交http://www.example.com/repaste/101562698_5230191316.htmlhttp://www.example.co

Public @ 2009-12-25 16:09:44

站点地图是什么

站点地图是一个网站所有链接的容器。很多网站的连接层次比较深,爬虫很难抓取到,站点地图可以方便爬虫抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名sitemap,为爬虫指路,增加网站重要内容页面的收录。站点地图就是根据网站的结构、框架、内容,生成的导航网页文件。站点地图对于提高用户体验有好处,它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。站点地图

Public @ 2013-03-27 16:11:51

更多您感兴趣的搜索

0.471642s