Categories


Tags


头条搜索站长平台-sitemapindex文件要求

sitemapindex文件根节点必须是<sitemapindex>。

sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。

sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。

sitemapindex文件大小不得超过5M,sitemap节点数量不超过1W。

必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。

1.XML数据文件规范

数据XML文件的根节点必须为<DOCUMENT>

数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>

数据XML文件禁止使用命名空间,禁止使用规定之外的属性。

数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。

除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’

数据节点中包含转义字符,请使用CDATA

对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同

2.Txt格式规范

Txt文件编码必须为UTF-8

Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址

Txt文件每行都必须有一个网址,网址中不能有换行

Txt文件中不能包含网址列表以外的任何信息

- 必须书写完整的网址,包含http/https

- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范

注意事项

提交的sitemap有作弊嫌疑的url,头条将进行严厉的处罚措施并取消相关权限

头条spider有自身的爬取规则,sitemap只是帮助头条spider更好的收录您的网站,提交sitemap并不会决定网站收录或者排名。

来源:头条搜索站长平台


Public @ 2013-06-03 16:09:47

我的 Sitemap 可以有多大?

单个Sitemap 应该小于 10MB(10,485,759字节),所包含的网址数最多为 50,000 个。如果您网站包含的网址超过 50,000 个或您的 Sitemap 超过 10MB,则需要创建多个 Sitemap 文件,并且需要使用 Sitemap 索引文件。Sitemap 索引文件应该小于 10MB(10,485,759字节),且最多可以包含1000个sitemap。

Public @ 2009-06-06 16:11:56

URL静态化还是不静态化?

数据库驱动的网站需要将URL静态化,一直以来都是SEO最基本的要求,可以算是个常识性的东西。现在恐怕也没有不是数据库驱动的网站了吧。近几年SEO行业一致认为,URL中带2-3个问号不是问题,搜索引擎通常都能收录,尤其是权重高点的域名,更多几个问号也不是问题。但无论如何一般还是建议URL静态化。2008年9月份,Google站长博客发表了一篇讨论动态网址还是静态网址的帖子,却颠覆了这个说法。在这篇帖

Public @ 2015-11-12 16:11:04

头条搜索站长平台-sitemap异常原因解释

sitemap异常原因解释解决方法爬虫被封禁可能是您的网站对Bytespider的UA或IP进行封禁建议您根据我们公布的UA和IP进行解封,第二天重新抓取之后会恢复正常sitemap文件数据量过大可能是您的sitemap节点数量超过了5w个建议您拆分为几个小的sitemap文件sitemap地址非法可能是您的sitemap地址不可访问或者存在xml和txt混合模式的数据建议您按照我们的要求提交si

Public @ 2021-01-02 16:09:47

什么是ETag?ETag作用有哪些

ETag 是一种用于标识网络资源的字符串。ETag 是由服务器为每个资源生成的,并且在资源内容发生变化时会改变。 ETag 主要用于缓存控制和条件请求。以下是 ETag 的一些作用: 1. 缓存验证:当客户端请求资源时,可以在请求头中通过 If-None-Match 字段将上一次请求中得到的 ETag 值发送给服务器。服务器可以根据这个值来判断资源是否发生了变化。如果 ETag 值匹配,服务器

Public @ 2023-07-30 17:50:26

更多您感兴趣的搜索

0.109465s