Categories


Tags


常见的robots.txt文件用法实例

常见的robots.txt文件用法实例:

1、禁止所有搜索引擎抓取网站的任何部分

User-agent: *

Disallow: /

这是禁止所有目录和文件被所有搜索引擎收录。网站还没上线时,有的会先屏蔽所有蜘蛛抓取。

2、允许所有的spider抓取(或者也可以建一个空的robots.txt文件)

User-agent: *

Allow: /

这是允许所有搜索引擎抓取网站的任何部分,既然是允许所有文件被抓取,可以不用创建robtos.txt文件,即默认全部允许抓取。

3、禁止spider抓取特定目录

User-agent: *

Disallow: /a/

Disallow: /b/

Disallow: /c/

这是禁止所有的spider抓取a、b、c目录。这个规则我们最常用到,比如网站的程序后台、程序目录等都可以禁止spider抓取,以减少spider无意义的浪费我们的空间资源。

4、禁止spider抓取搜索结果页面

User-agent: *

Disallow: /so_article?*

如果你网站的搜索结果页面URL格式如:/so_article?keyword=搜索关键字,则按以上格式进行屏蔽,注意最后带了一个星号*,代表屏蔽so_article?带头的所有URL。

对于大部分网站,常用的就是以上4种情况。

来源:搜外网


Public @ 2010-05-21 16:09:23

360搜索站长平台Sitemap提交流程

要提交Sitemap到360搜索站长平台,您可以按照以下流程操作: 1. 登录360搜索站长平台。如果您还没有账号,可以直接使用360账号登录。 2. 在站长平台首页,点击左侧菜单栏的“网站管理”。 3. 在网站管理页面,找到您需要提交Sitemap的网站,点击网站名称进入网站详情页面。 4. 在网站详情页面,点击左侧菜单栏的“站点地图”。 5. 在站点地图页面,点击“新建地图”按钮。

Public @ 2023-07-28 07:00:21

静态URL是什么?静态URL优点和缺点

静态URL是指在网页中固定不变的URL链接,不依赖于用户的操作或数据库动态生成,而是由网站的开发者手动编写或生成的。 静态URL的优点包括: 1. 简洁直观:静态URL通常是简短、易于理解的,可以清晰地表达页面的内容和结构。 2. 便于搜索引擎索引:搜索引擎可以更容易地识别和索引静态URL,提高网站的搜索排名。 3. 可读性好:用户可以直接从URL中了解到页面的主题和内容,增加用户的点击意愿。

Public @ 2023-07-26 10:00:35

robots是什么?

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。搜索引擎通过一

Public @ 2017-11-12 16:09:33

如何使用Robots避免蜘蛛黑洞?

蜘蛛黑洞:蜘蛛黑洞指的是网站通过极低的成本运营,制造出大量和内容相识但参数不同的动态URL ,像一个无限循环的“黑洞”将蜘蛛困住,蜘蛛花费太多的时间在网站,浪费了大量资源抓取的网页为无效网页。如果你的网站存在蜘蛛黑洞现象,尽快的处理好,蜘蛛黑洞不利于网站的收录,也会影响搜索引擎对网站的评分。如何使用Robots避免蜘蛛黑洞?如何利用Robots避免蜘蛛黑洞操作:普通的筛选结果页基本都是使用静态链接

Public @ 2014-02-24 16:09:26

更多您感兴趣的搜索

0.414470s