Categories


Tags


Robots.txt 文件应放在哪里?

obots.txt 文件必须放在网站的根目录。

放在子目录的 Robots.txt 文件搜索引擎不能爬取到,所以不会起任何作用。

如:

https://www.seowhy.com/robots.txt    是有效的。

https://www.seowhy.com/a/robots.txt  是无效的。

以下3种情况需要注意:

1、如果手机网站采用的是m.的二级域名,要给手机网站设置robots.txt的话,robots.txt要放在m. 这个二级域名的根目录下,而不是www的根目录。

2、给网站添加了一个站内站,如果要屏蔽某链接,是在www根目录下的robots里屏蔽,而不是给站内站创建独立的robtos.txt文件。

3、网站有多个二级域名的话,应该每个二级域名设置一个robots.txt。搜外问答的例子,点击查看。

来源:搜外网


Public @ 2018-08-20 16:09:23

robots使用误区

误区一:我的网站上的所有文件都需要蜘蛛抓取,那我就没必要在添加robots.txt文件了。反正如果该文件不存在,所有的搜索蜘蛛将默认能够访问网站上所有没有被口令保护的页面。每当用户试图访问某个不存在的URL时,服务器都会在日志中记录404错误(无法找到文件)。每当搜索蜘蛛来寻找并不存在的robots.txt文件时,服务器也将在日志中记录一条404错误,所以你应该做网站中添加一个robots.txt

Public @ 2017-10-31 16:09:18

相对路径的优点和缺点

相对路径的优点是:1.节省代码。2.移动内容比较容易,不用更新其他页面上的链接。3.在测试服务器上进行测试也比较容易。相对路径的缺点是:1.页面移动位置,里面链接可能需要改动。2.被抄袭和采集对网站没有任何益处。很多采集软件其实是可以自动鉴别绝对路径和相对路径的,所以使用绝对路径有助于自己的链接也被抄袭到采集网站上,只在某些情况下有效。3.搜索引擎解析URL时可能出错,不能正确读取页面上的链接UR

Public @ 2022-10-28 16:11:47

robots.txt语法教程

robots.txt 是一个文件,它位于网站的根目录下,用于告诉搜索引擎和机器人哪些页面可以被访问或哪些不应该被访问。以下是 robots.txt 语法教程。 1. User-agent User-agent 表示搜索引擎或机器人的名称。当网站管理员想要禁止某个搜索引擎或机器人访问网站时,可以使用 User-agent 指定名称。 例如: User-agent: Googlebot Dis

Public @ 2023-06-06 11:00:18

更多您感兴趣的搜索

0.511561s