Categories


Tags


robots.txt语法教程

用几个最常见的情况,直接举例说明:

1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。

2. 禁止所有SE收录网站的某些目录:

User-agent: *

Disallow: /目录名1/

Disallow: /目录名2/

Disallow: /目录名3/

3. 禁止某个SE收录本站,例如禁止百度:

User-agent: Baiduspider

Disallow: /

4. 禁止所有SE收录本站:

User-agent: *

Disallow: /

5. 加入sitemap.xml路径,例如:

来源:360站长平台


Public @ 2017-12-16 16:09:16

站点地图创建方法

1. 用所需软件打开网站:   打开一个文本编辑器,比如 Notepad 或者 Sublime Text,用来编辑 xml 文件; 2. 组织网站地图:   列出网站中每一个页面的具体地址,用符号 * 表示页面间的关联结构; 3. 用 xml 标准编写网站地图:   将网站地图的内容按照 xml 的规范编写;   主要的元素有,<urlset>,<url>,

Public @ 2023-03-02 11:48:25

网站结构有哪些类型1:什么是树状结构

我们都知道,搜索引擎喜欢的网站结构是树状结构,树状结构符合人们对知识的归类习惯。比如:图书馆的阅览室分为:自然科学阅览室、人文科学阅览室、报刊杂志阅览室。这几个阅览室内的书架又分为:自然科学阅览室:数学、物理、化学…人文科学阅览室:哲学、诗歌、小说…每个书架又会详细划分,比如数学有:高等数学、基础数学等。搜索引擎的数据库可以类比为一个超级图书馆,每个网站相当于这个超级图书馆某阅览室里的一个小书架。

Public @ 2019-06-10 16:12:09

robots协议

 Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫扫除规范”(RobotsExclusionProtocol),网站经过Robots协议通知查找引擎哪些页面可以抓取,哪些页面不能抓取  是查找引擎的一部分来定位和索引互联网上的每个可能答复查找恳求的网页,一般只在评论robots的HTML标签或许robots.txt文件的时分运用。

Public @ 2010-10-17 15:26:25

更多您感兴趣的搜索

0.450840s