Categories


Tags


通过robots.txt文件屏蔽蜘蛛抓取不存在的后缀

通过网站日志分析,会发现搜索引擎蜘蛛抓取了一些网站上不存在的文件后缀,如:.php、.asp、.aspx等。

搜外网站后台日志分析结果如下图:

image.

搜外主站实际上不存在php后缀的URL地址。

可通过robots.txt文件禁止蜘蛛抓取不存在的后缀,减少出现404返回值。

在robots.txt文件填写屏蔽规则如下:

Disallow: /*.asp$

Disallow: /*.php$

Disallow: /*.aspx$

注意前面一个*,后面一个$,代表后缀。

参考搜外的robots.txt文件写法,点击这里

来源:搜外网


Public @ 2015-07-18 16:09:24

301转向有哪些用途?

除了解决网址规范化问题,还有很多需要做301转向的情形。比如,为保护版权,公司拥有不同TLD的多个域名:?seowhy.com?seowhy.net?seowhy.org?seowhy.com.cn?seowhy.cn为避免造成大量复制内容,应该选定一个为主域名,如seowhy.com,其他域名做301转向到seowhy.com。网站改版经常需要用到301转向,如页面删除、改变地址、URL命名系统

Public @ 2018-03-29 16:09:36

站点地图创建方法

1. 用所需软件打开网站:   打开一个文本编辑器,比如 Notepad 或者 Sublime Text,用来编辑 xml 文件; 2. 组织网站地图:   列出网站中每一个页面的具体地址,用符号 * 表示页面间的关联结构; 3. 用 xml 标准编写网站地图:   将网站地图的内容按照 xml 的规范编写;   主要的元素有,<urlset>,<url>,

Public @ 2023-03-02 11:48:25

robots.txt文件的格式

User-agent: [robot名稱] Disallow: [禁止存取的目錄或檔案] Allow: [允許存取的目錄或檔案] Sitemap: [網站地圖檔案位置] 注意事項: - User-agent:要設定的是區分搜索引擎的機器人,可設定多個。若不加此欄位,則視為通用設定。 - Disallow:機器人不可存取的目錄或檔案,在此設定時,要注意目錄名稱或檔案名稱是完整的,不

Public @ 2023-06-17 03:50:39

更多您感兴趣的搜索

0.439906s