Categories


Tags


网站日志分析能反馈什么?

一个seo工作人员,特别是那些大型网站的seo人员来说,能独立分析网站日志是一种必不可少的技能,因为大型的网站栏目结构以及页面非常的繁杂,蜘蛛也是少不了会频繁访问,从蜘蛛给网站留下的一些痕迹上面能够掌控网站不少的信息,这对网站优化运营是一种非常必要的参考,前面小星星的文章里面也对蜘蛛状态码也进行了初步的介绍,这篇文章也对网站日志能读取到的信息作出了总结:

分析网站日志能获取到的信息总结:

一、可以看出网站页面有哪些搜索引擎的蜘蛛抓取

从网站日志里面可以看出网站被哪些蜘蛛所抓取,每个类型的蜘蛛也都属于自己的特殊标头,各大搜索引擎的标头特征如下所示:

百度蜘蛛:baiduspider

谷歌蜘蛛:Googlebot

360蜘蛛:360Spider

SOSO蜘蛛:Sosospider

雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!

有道蜘蛛:YoudaoBot,YodaoBot

搜狗蜘蛛:Sogou News Spider

MSN蜘蛛:msnbot,msnbot-media

必应蜘蛛:bingbot

提醒:网站的日志里面也有可能会出现一些其它私人开发的抓取器所抓取,由此我们可能会发现一些奇怪的蜘蛛抓取痕迹。另外百度也有属于自己的匿名蜘蛛,我们也要注意区分注意。

二、可以统计网站目录蜘蛛抓取的总量

通过抓取总量的分析可以对比出网站哪个目录更受搜索引擎的关注,一般来说蜘蛛抓取越频繁的目录,site网站此目录的排名会相对靠前,我们也可通过目录的蜘蛛访问量来适当调整目录的结构,对于那些抓取压力较大但是不怎么重要的目录也可适当缩减链接入口,以免阻碍给其它重要目录的抓取。

三、网站页面的抓取。

可以从中看出哪个页面蜘蛛是否抓取了一些没有被收录价值的页面,或者老是重复的抓取了这些页面等,那么同理要先采取措施予以频闭,要么是运用到nofollow标签,要么是robots文件等,这样就会降低因为搜索引擎抓取到大量相关性低或者质量度差的页面而影响到页面的权重传递这样的不利影响。

四、蜘蛛平均抓取页面的次数、页面平均停留时间以及抓取的数量。

(1)、平均每次抓取页面数=总抓取量/访问次数

(2)、单页抓取停留时间

(3)、页面平均停留时间=总停留时间/访问次数

从以上的分析能够很清晰的看出蜘蛛是否频繁关注自己的网站,而且抓取的页面越多,深度越足也能反映出网站的活跃度高,而且在停留的时间上面也能初步看出网站的页面和文章是否新颖或者原创,这是页面质量度的一个体现。

五、可以一览蜘蛛方面各网页的状态码

状态码是网站日志里面最重要的一个方面了,这是蜘蛛对于网站页面状态最直观的反映,从这些状态码中可以看出更多详细的信息。

六、了解网站日志蜘蛛的来访时间

对网站日常日志分析总结中,可以很直观的看出每天具体是哪个时间段是蜘蛛访问的高峰时期,我们为了迎合搜索引擎,也可以相应调整网站的更新时间,争取在蜘蛛活跃度最高的时间段更新文章,这样对自己网站的收录会有非常大的帮助,甚至还有可能达到秒收的效果!

总之,分析网站日志是一个非常有意义的技能,特别是网站建立的初期和运营遇到状况的时候,分析日志这个方面就更是尤为重要,当然再碰到信息量特别大的时候,单手动看效果是不好的,这里推荐光年日志分析工具,功能非常强大,基本能很好的满足一般网站的分析需求。

来源:搜外网


Public @ 2010-01-05 15:32:50

Matt Cutts谈大爸爸数据中心,补充材料网页及收录网页数下降

在大爸爸数据中心更新结束后,很多站长发现被收录的网页数急剧下降。有时候能从几万页降到几页,而且补充材料网页越来越多。很多人一直在问,为什么Matt Cutts对这个问题一直不做评论?今天Matt Cutts发了一个很长的帖子,一次性回答大爸爸更新之后的一些问题。帖子很长,下面拣要点翻译一下。首先Matt Cutts给那些不想读这么长帖子的人两点小结。第一,Google的爬行和索引部门有足够的机器。

Public @ 2022-08-05 15:30:12

专题页面优化的三个技巧

1. 优化页面标题和描述:页面标题和描述是搜索引擎看到的第一件事情,要包含主要关键词和实际页面内容,同时吸引搜索用户的注意力,增加点击率和流量。 2. 提供高质量内容:网站内容越独特、知识性更深入,页面排名越高,因此要确保页面有高质量、相关性强的内容,包括文字、图片、视频等。 3. 添加内部链接:在页面内添加内部链接可以改善页面结构,提升用户体验和搜索引擎收录,同时可以帮助搜索引擎了解网站架构

Public @ 2023-06-21 04:50:09

分析网站日志有什么用?如何进行日志分析?(SEO技巧)

很多新手SEO站长可能觉得不去分析网站日志也无关紧要,相信大家都在自己的网站上安装了网站统计的代码,如Google analytics、量子统计、百度统计、cnzz、51.la等。这些工具可以统计网站的流量,但是这些统计工具都不能统计你主机上资源的原始访问信息,例如某个图片被谁下载了,也不能统计到那些没有添加统计代码的地方,比如后台操作页面。绝大多数收费主机都提供原始访问日志,网站服务器会把每一个

Public @ 2017-08-09 15:32:55

网站日志(weblog)

网站日志是记载web效劳器接收处理恳求以及运行时过错等各种原始信息的以log结束的文件,切当的讲,应该是效劳器日志,网站日志最大的含义是记载网站运营中比方空间的运营状况,被拜访恳求的记载,经过网站日志可以清楚的得知用户在什么IP、什么时刻、用什么操作系统、什么阅览器、什么分辨率显现器的状况下拜访了你网站的哪个页面,是否拜访成功。  在网站效劳器上的一个文件,作为效劳器所履行的每个操作的记载,日志文

Public @ 2023-01-29 15:32:56

更多您感兴趣的搜索

0.413783s