Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

域名与搜索引擎优化

除了.edu 和.gov域名可能被列为被信任的域名外,与域名有关的一些其他因素也可能会影响搜索引擎排名。很多人都知道,Google在2005年2月正式申请成为域名注册服务商。不是大家随处可见的那种域名注册代理,而是顶级域名注册服务商。全世界.com域名注册服务商只有100多个。一年多过去了,Google并没有开始提供域名注册服务。而且Google曾经说过,他们成为域名注册商,并不是为了给用户提供域

Public @ 2022-09-22 15:25:24

哪些内容会被百度判别为垃圾内容

站长通过挖词工具可以明确捕获用户需求的关键词,围绕关键词来创造内容。而并非所有的内容都能满足用户需求,现在越来越多的站点,为了获取大量的流量,通过工具制造出大量垃圾的内容。垃圾内容指的是没有为用户带来帮助,反而出现伤害用户的内容。严重影响了搜索结果的质量和用户体验。被百度判别为垃圾内容案例说明:1、主题不符的内容群发通常是大面积群发内容,站点或论坛版块主题会出现于网站不相关的内容信息。站长需要定期

Public @ 2017-07-24 15:32:46

网站日志分析能反馈什么?

一个seo工作人员,特别是那些大型网站的seo人员来说,能独立分析网站日志是一种必不可少的技能,因为大型的网站栏目结构以及页面非常的繁杂,蜘蛛也是少不了会频繁访问,从蜘蛛给网站留下的一些痕迹上面能够掌控网站不少的信息,这对网站优化运营是一种非常必要的参考,前面小星星的文章里面也对蜘蛛状态码也进行了初步的介绍,这篇文章也对网站日志能读取到的信息作出了总结:分析网站日志能获取到的信息总结:一、可以看出

Public @ 2010-01-05 15:32:50

服务器日志在SEO里的常见用途

服务器日志在SEO里的常见用途有哪些呢?服务器日志用来记录网站被访问的全过程,我们可以从中看到,什么时间有哪些用户(搜索引擎)来过?都访问过哪些内容?访问时是否出错?等一些基础的访问行为。1、修正抓取分布对于大型站点,尤其是海量数据的网站,相对每个页面资源来说,其获取到的抓取资源也是非常有限的。这很有可能就会导致些版块SEO产生问题。比如网站有10个核心的栏目内容,但是其中有5个是被爬虫顿繁抓取的

Public @ 2013-06-18 15:32:50

更多您感兴趣的搜索

0.598208s