头条搜索站长平台-sitemapindex文件要求
sitemapindex文件根节点必须是<sitemapindex>。
sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。
sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。
sitemapindex文件大小不得超过5M,sitemap节点数量不超过1W。
必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。
1.XML数据文件规范
数据XML文件的根节点必须为<DOCUMENT>
数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>
数据XML文件禁止使用命名空间,禁止使用规定之外的属性。
数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。
除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’
数据节点中包含转义字符,请使用CDATA
对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同
2.Txt格式规范
Txt文件编码必须为UTF-8
Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址
Txt文件每行都必须有一个网址,网址中不能有换行
Txt文件中不能包含网址列表以外的任何信息
- 必须书写完整的网址,包含http/https
- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范
注意事项
提交的sitemap有作弊嫌疑的url,头条将进行严厉的处罚措施并取消相关权限
头条spider有自身的爬取规则,sitemap只是帮助头条spider更好的收录您的网站,提交sitemap并不会决定网站收录或者排名。
来源:头条搜索站长平台