站点地图生成工具
Xenu Link Sleuth
可同时生成html格式地图(适用于小型站点)和XML格式地图。
XML Sitemap
在线生成工具,网站地址很多时,会比较浪费时间,要是生成所有的时候需要收费。
Sitemap Generator
强大的sitemap生成器,需下载安装客户端
用几个最常见的情况,直接举例说明:1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。2. 禁止所有SE收录网站的某些目录:User-agent: *Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/3. 禁止某个SE收录本站,例如禁止百度:User-agent: BaiduspiderDisallow: /4. 禁止所有SE收录
在进行网站优化的时候,经常会使用robots文件把一些内容不想让蜘蛛抓取,以前写过一篇网站优化robots.txt文件的运用 现在写这篇文章在补充一点点知识!什么是robots.txt文件搜索引擎通过一种爬虫spider程序(又称搜索蜘蛛、robot、搜索机器人等),自动搜集互联网上的网页并获取相关信息。鉴于网络安全与隐私的考虑,搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件r
ETag是HTTP头的一部分,它是一个字符串标识一个web资源的特定版本。它由web服务器生成,用于标识文件的实体标签。ETag可以用来确定同一资源是否已被修改,这在缓存和验证客户端缓存文件是否过期时很有用。ETag的作用如下: 1.缓存控制:在HTTP响应头部中包含ETag可以帮助浏览器缓存和验证资源。如果资源没有发生任何改变,浏览器可以直接从本地缓存中获取资源,而不需要重新从服务器获取。
百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:1.第一种格式样例:txt文本格式在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交http://www.example.com/repaste/101562698_5230191316.htmlhttp://www.example.co