Categories


Tags


头条搜索Robots匹配说明

匹配方式

分两部分:1.path部分,2.参数部分

匹配支持?*$?两种通配符

?*? 表示任何有效字符的 0 个或多个个案。

?$? 表示网址结束。

path部分

与google匹配方式保持一致,也就是只有/或是*开头的规则才有机会匹配上

?/?

匹配根目录以及任何下级网址

?/fish?

?/fish?开头的

匹配项

* ?/fish?

* ?/fish.html?

* ?/fish/salmon.html?

* ?/fishheads?

* ?/fishheads/yummy.html?

* ?/fish.php?id=anything?

不匹配项

* ?/Fish.asp?

* ?/catfish?

* ?/?id=fish?

?/fish\*?

等同于 ?/fish?。结尾的通配符会被忽略。

匹配项:

* ?/fish?

* ?/fish.html?

* ?/fish/salmon.html?

* ?/fishheads?

* ?/fishheads/yummy.html?

* ?/fish.php?id=anything?

不匹配项:

* ?/Fish.asp?

* ?/catfish?

* ?/?id=fish?

?/fish/?

结尾的斜杠表示此项与此文件夹中的任何内容均匹配。

匹配项:

* ?/fish/?

* ?/fish/?id=anything?

* ?/fish/salmon.htm?

不匹配项:

* ?/fish?

* ?/fish.html?

* ?/Fish/Salmon.asp?

?/\*.php?

匹配项:

* ?/filename.php?

* ?/folder/filename.php?

* ?/folder/filename.php?parameters?

* ?/folder/any.php.file.html?

* ?/filename.php/?

不匹配项:

* ?/?(即使其映射到 /index.php)

* ?/windows.PHP?

?/\*.php$?

匹配项:

* ?/filename.php?

* ?/folder/filename.php?

不匹配项:

* ?/filename.php?parameters?

* ?/filename.php/?

* ?/filename.php5?

* ?/windows.PHP?

?/fish\*.php?

匹配项:

* ?/fish.php?

* ?/fishheads/catfish.php?parameters?

不匹配项: ?/Fish.PHP?

?\*/ `` fish `` /?

包含/fish/的path

匹配项:

* ?/search/fish/filename.php?parameters?

* ?/fish/filename.php?parameters?

不匹配项:

* ?/Fish.PHP?

?.htm$?

错误写法,不能与.htm结尾的url匹配

参数部分

支持参数无序匹配,参数key value均支持?\*?通配符

?/home.php?mod=?

value可以是任意值

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=xxx?

不匹配项

* ?/home.php?c=0&smod=939?

* ?/home.php?c=0&mods=939?

?/home.php?mod=\*?

value可以是任意值,等同于?/home.php?mod=?

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=xxx?

不匹配项

* ?/home.php?c=0&smod=939?

* ?/home.php?c=0&mods=939?

?/home.php?mod=9?

参数值要求完全相对才匹配

匹配项

* ?/home.php?c=0&mod=9?

不匹配项

* ?/home.php?c=0&mod=939?

?/home.php?mod=9\*?

value以9开头的

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=9xx?

* ?/home.php?c=0&mod=9?

不匹配项

* ?/home.php?c=0&mod=3xx?

* ?/home.php?c=0&mod=39x?

?/home.php?mod=\*9?

value以9结尾

匹配项

* ?/home.php?c=0&mod=xx9?

不匹配项

* ?/home.php?c=0&mod=34?

* ?/home.php?c=0&mods=9?

* ?/home.php?c=0&mod=93?

?/home.php?mod=\*39?

value以39结尾的

匹配项

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&mod=9319?

?/home.php?\*mod=939?

key以mod结尾的

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&smod=939?

不匹配项

* ?/home.php?c=0&mods=939?

?/home.php?mod\*=939?

key以mod开头的

匹配项

* ?/home.php?c=0&mods=939?

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&smod=939?

?/home.php?\*mod\*=939?

key包含mod字符串

匹配项

* ?/home.php?c=0&smods=939?

* ?/home.php?c=0&mods=939?

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&smod=939?

不匹配项

* ?/home.php?c=0&msod=939?

?/home.php?\*mod\*=\*39\*?

key 包括mod字符串,value包含39字符串

匹配项

* ?/home.php?c=0&smods=939?

* ?/home.php?c=0&smod=39?

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&msod=93?

?/home.php?mod?

参数部分采用前缀匹配

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mods=939?

不匹配

* ?/home.php?c=0&smod=939?

?/home.php?mod\*?

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mods=939?

不匹配项

* ?/home.php?c=0&smod=34

来源:头条搜索站长平台


Public @ 2011-09-27 16:09:01

nofollow标签的作用有重大变化

nofollow标签最初是由Google引入的,旨在告诉搜索引擎跟踪链接的方式。它的作用是让网站管理员控制搜索引擎是否跟踪某个链接并传递权重。也就是说,如果一个页面包含了nofollow标签,搜索引擎就不会将该页面与被链接的页面相关联,也不会将该页面作为链接目标的一部分考虑。这样可以避免一些不必要的链接传递权重,同时可以防止人工操纵搜索引擎排名。 然而,随着时间的推移,nofollow标签的作用

Public @ 2023-06-05 14:00:19

什么是Flash

Flash 是一种创作工具,设计人员和开发人员可使用它来创建演示文稿、应用程序和其它允许用户交互的内容。Flash 可以包含简单的动画、视频内容、复杂演示文稿和应用程序以及介于它们之间的任何内容。通常,使用 Flash 创作的各个内容单元称为应用程序,即使它们可能只是很简单的动画。您可以通过添加图片、声音、视频和特殊效果,构建包含丰富媒体的 Flash 应用程序。整个网站就是一个大Flash文件,

Public @ 2017-12-14 16:21:36

禁止搜索引擎收录的方法

1. 什么是robots.txt文件?搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当

Public @ 2015-10-28 16:08:55

robots

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。来源:360站

Public @ 2014-01-16 16:09:19

更多您感兴趣的搜索

0.675170s