Categories


Tags


通过robots.txt文件屏蔽蜘蛛抓取不存在的后缀

通过网站日志分析,会发现搜索引擎蜘蛛抓取了一些网站上不存在的文件后缀,如:.php、.asp、.aspx等。

搜外网站后台日志分析结果如下图:

image.

搜外主站实际上不存在php后缀的URL地址。

可通过robots.txt文件禁止蜘蛛抓取不存在的后缀,减少出现404返回值。

在robots.txt文件填写屏蔽规则如下:

Disallow: /*.asp$

Disallow: /*.php$

Disallow: /*.aspx$

注意前面一个*,后面一个$,代表后缀。

参考搜外的robots.txt文件写法,点击这里

来源:搜外网


Public @ 2015-07-18 16:09:24

博客网站导航的制作

制作博客网站导航的步骤如下: 1. 设计导航栏的样式与布局: 根据网站的整体风格和主题,设计导航栏的外观,包括颜色、字体、按钮等。决定导航栏的位置,一般常见的位置有网站顶部、侧边栏或底部。 2. 确定导航栏的内容:确定导航栏要显示的链接或按钮,一般包括首页、分类、标签、关于我们、联系我们等。可以根据博客的特点,自定义所需的导航栏内容。 3. 创建HTML导航栏的代码:使用HTML和 CSS编

Public @ 2023-07-26 12:00:41

内部链接(站内链接)的优化

内部链接优化是指在同一网站内部进行链接的优化,目的是为了提高网站的用户体验和搜索引擎的友好度。以下是内部链接优化的几个方面: 1.关键词内部链接 在网站内部的文章中,通过给关键词添加链接的方式来提高网站的页面权重,也可以让用户更快地发现和阅读相关的文章。 2.增加网站导航 通过增加网站导航菜单,可以提高网站的用户体验和搜索引擎优化,减少用户的跳出率,提高网站的访问量和转化率。 3.注重链

Public @ 2023-06-22 10:50:21

禁止搜索引擎收录的方法

1. 什么是robots.txt文件?搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当

Public @ 2015-10-28 16:08:55

robot.txt在SEO中的作用

Robots.txt 是一个网站管理员可通过在站点根目录中放置一个名为robots.txt的文件来让搜索引擎(及其爬虫)知道该如何来收录并处理某些目录或页面,并使索引过程更加有效更加规范。 Robots.txt 的作用是向搜索引擎解释网站中哪些目录和文件希望被搜索引擎收录、哪些不希望收录,以避免搜索引擎抓取到网站误差的内容。如果 robots.txt 被恰当地设置,可以有效提高收录质量和网站

Public @ 2023-03-03 03:00:14

更多您感兴趣的搜索

0.431764s