Categories


Tags


robots.txt概念和10条注意事项

robots.txt概念

如果我们网站内有某些特殊的文件不让搜索引擎收录,那怎么办?

答案是:使用一个叫做robots.txt的文件。

robots.txt文件告诉搜索引擎本网站哪些文件是允许搜索引擎蜘蛛抓取,哪些不允许抓取。

搜索引擎蜘蛛访问网站任何文件之前,需先访问robots.txt文件,然后抓取robots.txt文件允许的路径,跳过其禁止的路径。

总结:robots.txt是一个简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。

关于robots.txt文件的10条注意事项:

1、如果未创建robots.txt文件,则代表默认网站所有文件向所有搜索引擎开放爬取。

2、必须命名为:robots.txt,都是小写,robot后面加"s"。

3、robots.txt必须放置在一个站点的根目录下。

通过如https://www.seowhy.com/robots.txt 可以成功访问到,则说明本站的放置正确。

4、一般情况下,robots.txt里只写着两个函数:User-agent和 Disallow。

5、空格换行等不能弄错,可复制这个页面并修改为自己的。点击

6、有几个禁止,就得有几个Disallow函数,并分行描述。

7、至少要有一个Disallow函数,如果都允许收录,则写: Disallow:

如果都不允许收录,则写:Disallow: /  (注:只是差一个斜杆)。

8、允许有多个User-agent,如果对所有爬取蜘蛛生效,则用“*”星号表示。

9、robtos.txt文件内可以放上Sitemap文件地址,方便告诉搜索引擎Sitemap文件地址。

10、网站运营过程中,可以根据情况对robots.txt文件进行更新,屏蔽一些不要搜索引擎抓取的文件地址。

举例两个常见屏蔽规则:

User-agent: *  星号说明允许所有搜索引擎收录

Disallow: /search.html   说明 https://www.seowhy.com/search.html 这个页面禁止搜索引擎抓取。

Disallow: /index.php?   说明类似这样的页面https://www.seowhy.com/index.php?search=%E5%A5%BD&action=search&searchcategory=%25 禁止搜索引擎抓取。

来源:搜外网


Public @ 2019-12-20 16:09:22

绝对路径与相对路径有什么区别?

绝对路径与相对路径有什么区别?在Html的应用中经常会涉及到绝对路径与相对路径的概念(如超级链接、图片等),这两种路径所表达的意义在于绝对路径可以精确引用,而相对路径则是模糊应用概念,只是在目标目录下找到引用,所以大多数Html工作者都会选择使用相对路径。绝对路径与相对路径有什么区别?相对路径的三种写法介绍  一、绝对路径  绝对路径是指文件在硬盘上真正存在的路径。例如“bg.jpg”这个图片是存

Public @ 2020-01-09 16:11:48

什么是robots文件

robots.txt是一个网站的根目录中的文件,用于告知搜索引擎哪些页面和文件可以被搜索引擎的爬虫访问,哪些不可以。该文件是遵循 robots协议的网站必不可少的一个文件,用于控制搜索引擎的爬虫访问网站的行为。通过robots.txt文件,网站管理员可以禁止搜索引擎爬虫访问一些无用或敏感的网站内容,或是避免搜素引擎爬虫访问较为频繁的API接口等。

Public @ 2023-05-30 08:00:08

百度站长平台robots工具升级公告

亲爱的网站管理员,很高兴的告诉大家,百度站长平台robots工具全新升级,升级后能够实时查看网站在百度中已生效的的robots文件,并支持对robots进行语法及逻辑校验,有助于站长更清晰的管理网站的robots文件,避免错误的封禁搜索引擎。功能亮点:1、实时查看网站在百度中已生效的robots文件内容并可通知百度更新:升级后的robots能够查看网站已生效的robots文件,同时会展现网站最新的

Public @ 2016-06-12 16:09:01

更多您感兴趣的搜索

0.415615s