Categories


Tags


百度Sitemap支持哪些格式

百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:

1.第一种格式样例:txt文本格式

在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交

http://www.example.com/repaste/101562698_5230191316.html

http://www.example.com/repaste/101586283_5230215075.html

http://www.example.com/repaste/101639435_5230310576.html

此文本文件需要遵循以下指南:

· 文本文件每行都必须有一个网址。网址中不能有换行。

· 不应包含网址列表以外的任何信息。

· 您必须书写完整的网址,包括 http。

· 每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。

· 文本文件需使用 UTF-8 编码或GBK编码。

2.第二种格式样例:xml格式

单个xml数据格式如下:

<?xml version="1.0" encoding="utf-8"?>

<!-- XML文件需以utf-8编码-->

<urlset>

<!--必填标签-->

<url>

<!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->

<loc>http://www.yoursite.com/yoursite.html</loc>

<!--必填,URL链接地址,长度不得超过256字节-->

<lastmod>2009-12-14</lastmod>

<!--可以不提交该标签,用来指定该链接的最后更新时间-->

<changefreq>daily</changefreq>

<!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->

<priority>0.8</priority>

<!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->

</url>

<url>

<loc>http://www.yoursite.com/yoursite2.html</loc>

<lastmod>2010-05-01</lastmod>

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

</urlset>

上述Sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html

若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向搜索资源平台进行提交。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-12-25 16:09:44

robots

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。来源:360站

Public @ 2014-01-16 16:09:19

百度搜索资源平台-sitemap全网开放及建议启用Etag的公告

亲爱的网站管理员:百度站长平台即将正式全网开放sitemap权限,所有通过百度站长平台验证的网站均可以在百度站长工具的链接提交里添加网站的sitemap,而从近期sitemap全网开放会进入内测阶段,站长平台会挑选没有sitemap提交权限的站点参加内测,内测的报名入口《申请sitemap全网开放内测名额》。另外,本次sitemap全网开放,将取消由站长来设置sitemap文件更新周期的功能,而是

Public @ 2013-01-24 16:09:46

关于Sitemap

百度一直致力于将优质内容索引并呈现给搜索用户,因此百度站长平台推出了Sitemap工具,网站可通过该工具将优质资源主动反馈提交给百度站长平台,加强百度对优质资源的收录,优化收录效果。Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页,包括百度通过传统抓取方式可能找不到的网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次

Public @ 2011-06-13 16:11:59

更多您感兴趣的搜索

0.396403s