Categories


Tags


做网站SEO优化,网站日志分析是必备的技能

网站的SEO优化过程中不免会分析网站日志,网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以更加清楚的知道网站的健康状况,使用这些数据更有利于开展网站SEO优化。

通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。对于专业从事搜索引擎优化工作者而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个IP的百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回的HTTP状态码。

常见的蜘蛛名称:

Baiduspider:百度蜘蛛

Baiduspider-Image:百度图片蜘蛛

Googlebot:谷歌机器人

Googlebot-Image:谷歌图片机器人

360Spider:360蜘蛛

sogou spider:搜狗蜘蛛

一、网站日志的作用

1、通过网站日志可以了解蜘蛛对网站的基本爬取情况,可以知道蜘蛛的爬取轨迹和爬取量。

2、网站的更新频率也和网站日志中蜘蛛抓取的频率有关,一般来说更新频率越高,蜘蛛的抓取频率越高,而我们网站的更新不仅仅只是新内容的添加同时还有我们的微调操作。

3、我们可以根据网站日志的反应情况,对我们的空间的某些事情和问题提前进行预警,因为服务器如果出问题的话在网站日志中会第一时间反映出来,要知道服务器的稳定速度和打开速度两者都会直接影响我们的网站。

4、通过网站日志我们可以知道网站的那些页面是很受蜘蛛欢迎的,而哪些页面是蜘蛛连碰都不去碰的,同时我们还能发现有一些蜘蛛由于是过度爬取对我们的服务器资源损耗是很大的,我们要进行屏蔽工作。

二、如何下载网站日志

1、首先我们的空间要支持网站日志下载,这一点是很重要的,在购买空间时候需事先了解下是否支持日志下载,因为有的服务商是不提供这项服务的,如果支持的话空间后台一般都有日志WebLog日志下载这个功能把它下载到根目录在用FTP传到本地就可以,服务器的话可以设置将日志文件下载到指定路径。

2、这里有个很重要的问题,网站日志强烈建议设置成每小时生成一次,小型的企业站和页面内容较少的网站可以设置成一天,它默认是一天,如果内容多或者大型站设置成一天生成一次,那么一天只生成一个文件,这个文件会相当的大,我们有时电脑打开是会造成死机,设置的话找空间商协调设置即可。

三、网站日志数据分析

1、网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer、WPS表格等

117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"

分析:

117.26.203.167访问ip;

02/May/2011:01:57:44 -0700访问日期 -时区;

GET/index.php HTTP/1.1根据HTTP/1.1协议抓取(域名下)/index.php这个页面(GET表示服务器动作);

500服务器响应状态码;

服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重定向。404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。500则是服务器的错误。

19967表示抓取了19967个字节;

Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar表示访问者使用火狐浏览器及Alexa Toolbar等访问端信息;

2、如果你的日志里格式不是如此,则代表日志格式设置不同。

3、很多日志里可以看到 200 0 0和200 0 64则都代表正常抓取。

4、抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好。

5、有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。

6、我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。

7、蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页。

四、通过网站日志我们能知道什么?

1、我们买的空间是否能够稳定?

2、蜘蛛对我们的那些页面比较喜欢而对哪些不喜欢?

3、蜘蛛什么时候抓取我们的网站频繁,我们需要什么时候更新内容?

总结:

所以不管是新站还是老网站,不管你做百度还是Google我们都能通过网站日志分析出来搜索引擎蜘蛛抓取的情况;如果网站长时间收录有问题,那么我们也可以对比网站日志中的搜索引擎蜘蛛行为,来了解网站是哪方面出了问题;如果网站被封,或者被K,我们都可以通过观察网站日志的情况来了解原因出在什么地方。我们要看的网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以简单明了的就知道网站的健康状况,可以利于我们更好的做网站优化,所以对于真正的SEO高手而言,分析蜘蛛日志是最直观,最有效的额。

来源:搜外网


Public @ 2012-07-16 15:32:52

Google网站质量指南

质量指南 - 基本原则设计网页时该考虑的是用户,而不是搜索引擎。 不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种,这种做法通常称为"隐藏".请不要为了提高搜索引擎排名而弄虚作假。 一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样

Public @ 2015-05-26 15:32:44

外贸SEO技巧:做外贸SEO一定要考虑这些细节上的处理

做外贸SEO需要考虑很多细节,以下是一些重要的处理方法: 1. 关键词研究和优化 关键词研究和优化是外贸SEO的基础,需要了解目标市场的搜索习惯和用语,选取与产品相关的关键词进行优化,保证关键词出现在标题、描述和正文中,并且合理分配密度,不过度堆砌。 2. 网站架构和优化 外贸网站的架构需要简洁明了,易于导航,同时考虑到国际化,应为不同国家的用户提供不同语言版本的网站。同时,需要优化网站速

Public @ 2023-06-13 09:50:49

服务器日志是什么?如何查看服务器日志?

服务器日志是指服务器所生成的记录了各种系统操作、网络请求、资源使用、错误信息等记录的文件。通过查看服务器日志,可以了解服务器的运行状态和问题,以便及时发现和解决各种问题。 具体查看服务器日志的方法取决于服务器的操作系统和日志管理工具的不同。以下是一些常见的查看服务器日志的方法: 1. 使用命令行工具:在Linux或UNIX系统中,可以使用命令行工具如tail、grep、less来查看日志文件。

Public @ 2023-08-01 04:00:18

分享两款日志分析工具,光年日志和andiislog

我先简单介绍下这两款网站日志工具,iislog相对比较简单,日志分析很清晰,可以看下图。iislog能清晰的看到蜘蛛来访时间、蜘蛛类型、蜘蛛IP、链接方式、服务器返回的代码、最后是蜘蛛访问网站的地址,一目了然。分享两款iis网站日志分析工具 光年日志分析工具和iislog日志分析工具光年日志分析工具在分析的数据上做得更加细化,概要分析处可以看到各搜索引擎蜘蛛来访次数 、总停留时间(小时) 、总抓取

Public @ 2009-09-07 15:32:54

更多您感兴趣的搜索

0.513857s