robots.txt文件放在哪里?
robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站时,首先会检查该网站中是否存在这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
Public @ 2019-06-21 16:09:32
robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站时,首先会检查该网站中是否存在这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
支持XML格式和TXT文本格式。
网站结构有以下类型: 1. 线性结构:网页按照线性顺序呈现,用户只能按照给定的路径进行操作。 2. 并列结构:网页中的多个页面并列展示,用户可以按照自己的意愿任意选择。 3. 分层结构:根据主题或类别将网页分成不同的层次,并且每一层都有相应的子页链接。 4. 网状结构:网页中的所有页面都可以互相连接,没有明确的层次结构。 5. 混合结构:以上几种结构的组合。 树状结构是一种分层结构,也称为层次
robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站时,首先会检查该网站中是否存在这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
我不确定你所指的“robots非标准扩展协议”是什么,因为Robot协议是Web爬虫标准协议之一,旨在告诉Web爬虫哪些页面可以爬取和哪些页面不应该被爬取。它是一个标准协议,而不是扩展协议。 如果您能提供更多信息,我可以尝试提供更详细的回答。