Categories


Tags


百度Sitemap协议

百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。每个Sitemap文件最多可包含50,000个网址,并且应小于 10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。

XML格式Sitemap说明:

XML格式举例:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <urlset>

        <url>

          <loc>http://www.example.com/</loc>

          <lastmod>2010-01-01</lastmod>

          <changefreq>always</changefreq>

          <priority>1.0</priority>

        </url>

        <url>

          <loc>http://www.example.com/1.html</loc>

          <lastmod>2010-02-14</lastmod>

          <changefreq>weekly</changefreq>

          <priority>0.8</priority>

        </url>

   </urlset>

索引Sitemap举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <sitemapindex>

     <sitemap>

       <loc>http://www.example.com/1.xml</loc>

       <lastmod>2010-01-01</lastmod>

     </sitemap>

     <sitemap>

       <loc>http://www.example.com/2.xml</loc>

       <lastmod>2010-02-01</lastmod>

     </sitemap>

   </sitemapindex>

具体格式及规范说明请查看:http://zhanzhang.baidu.com/site/format

XML标签说明:



百度Sitemap协议-第1张图片-SEO自学网


文本格式Sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:


?         文本文件每行都必须只有一个网址。网址中不能有换行。


?         您必须指定完整的网址,包括“http://”。


?         每个文本文件最多可包含50,000个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。


?         文本文件需使用UTF-8编码或GBK编码。


?         文本文件不应包含网址列表以外的任何信息。


?         您可以使用gzip压缩Sitemap文件,以减少带宽要求;但是压缩前的Sitemap文件应小于10MB(10,485,760字节)。

使用Sitemap索引文件(对多个Sitemap文件)说明:

使用Sitemap索引文件必须:


?         以开始标记作为开始,以结束标记作为结束。


?         每个Sitemap包含一个条目作为 XML 父标记。


?         每个父标记包含一个子标记条目。


Sitemap索引文件标签说明:



百度Sitemap协议-第2张图片-SEO自学网



Public @ 2021-10-21 16:11:58

robots

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。来源:360站

Public @ 2014-01-16 16:09:19

Sitemap文件标准格式和大小说明

Sitemap文件标准格式: Sitemap文件通常是一个以XML格式编写的文本文件,其中包含URL信息和其他相关数据。Sitemap文件主要包含以下元素: 1. URL元素:用于指定页面的网址,并包含可选的数据,如最近的修改日期、相对于站点的相对权重等。 2. loc元素:为URL元素的子元素,用于指定页面的网址。 3. lastmod元素:为URL元素的子元素,用于指定页面的最近修改日期。

Public @ 2023-04-29 02:50:12

sitemap里有大量的转码链接,是否有影响?

问sitemap里爬出了心中链接,要将它改成静态的吗?使用sitemap工具,生成了sitemap,里面有大量的转码链接,这些链接都是tag页的。11-8.应该是TAG和html之间的这个应该是调用的什么东西,在浏览器里会变成中文。sitemap里不用改,这个可以吗?像这样 html结尾的,就是静态页面。在sitemap里,就是这个地址。  浏览器里是显示为中文E6%AF%8D%E5%A

Public @ 2020-06-01 16:09:51

更多您感兴趣的搜索

0.670055s