Categories


Tags


如何保证网站长期的SEO健康度

4月底的北京移动化培训后,我们认识了艺龙SEO负责人刘明,他认为很多SEOer是只看整体数据判断网站是否有问题,而站点应该做的是每周出具一份详细科学的体检报告,能最早从很多细节指标上发现问题——学堂感觉这个内容非常有价值,于是请刘明做了分享:

本篇文章的意义之一,很多站长对自己网站健康状况没有头绪:

在百度举办的活动上,有不少的站长会向百度工作人员提出一些根本无法回答的问题:收录掉了,怎么办?抓取掉了,怎么办?流量掉了,怎么办?排名掉了,怎么办?收录不及时,怎么办?

这些问题太笼统了,即使把百度所有后台数据完全开放,也无法解答。提问的人肯定是连网站的基本结构都没有清晰的认识。好的问题是怎样的?耐心看完就有答案了。

本篇文章的意义之二,产品改版对SEO造成毁灭性打击

SEO最严重的问题,往往不是SEO问题,而是产品问题,或技术问题。有些大型网站每次大改版都是这样的:

1,会更换一套URL pattern。

2,由于数据的不兼容,旧版本pattern无法301到最新版。

3,即使数据兼容,也忘了做301。

我问过一个产品经理,这个产品的URL换过多少pattern, 答案是3到4个。但是我从web.archive.org上看,最少8个。平均每年换一个。稍微有一点搜索引擎基本常识的人应该能意识到,这种网站是典型的no zuo no die。

本篇文章的意义之三,长期的迭代开发流程中,SEO的需求可能被逐步改错

在产品,技术和测试的思维中,往往是没有URL的清晰定义的,只要页面能访问,内容是对的就合格了.以下几种URL都是被认为没问题的,更不要提SEO的其他基本规范了。也就是说,事实上除了SEO没有人关心这些东西,每个开发环节都可能遗漏或者搞错一些东西:

1,http://www.a.com/product(category)/

2,http://www.a.com/product.html/

3,http://www.a.com/product/?channel=123&category=abc&brand=def&tracking=other_website

曾经有一个产品,本来谷歌收录量达到了3000万,百度收录2000万,流量也不错,精力挪到别的产品上去了。 过了1个月发现流量有所下滑,以为是季节因素,没有在意,又过了2个月,流量下降非常多。仔细检查了一下发现一个惊人的变化。

1,本来收录的地址是http://www.a.com/product/item100.html

2,在没有被告知的情况下,被技术同事加了一个301跳转,到http://www.a.com/search/?product=a&item=100

3,其中/search/目录在robots.txt中是Disallow的

4,在随后的2周内,收录量最低降到了300万左右。

我希望能有个系统自动的帮我梳理这些问题,让我不再每天担忧SEO的需求又不知道被谁弄掉了,如果有问题,能让开发测试的同事马上就收到警报,让“擦屁股”的事情不再占用我太多时间。

内容思维导图,元信息,页面单元测试,蜘蛛日志监控

鉴于前边几点,我的解决方案是:

? 内容思维导图

? 元信息

? 页面单元测试

? 蜘蛛日志监控

这些方案5年前就构思好了,并且小规模试用,但是由于复杂度和开发成本较高,到过很多坑。直到最近两年才逐步启用。绝对不适用于小公司,请广大SEO从业者慎重决策。

? 内容思维导图

从产品的角度看是这样由各类功能组成的,有合理流程关系的(流程不展开讨论),符合用户体验的,但可能不符合搜索引擎体验:

从SEO的角度看,网站的结构是这样由各类用户搜索需求组成的,也是有合理层级关系的:

不同的网站会有截然不同的思维导图,因为他可能基本取决于技术架构。因此建议SEO从业者深入了解网站的技术架构之后再来绘制导图。具体的细节暂不展开。但是最起码自己要保证这几点:

1,网站有哪些内容节点

2,哪些命中了用户的需求

3,哪些是毫无检索意义的

4,缺少哪些节点

5,应该如何部署层级关系

思维导图绝对不是一劳永逸的,每当产品有新的pattern上线,或者旧的pattern下线,需要及时更新。每当你发现新的用户搜索习惯,也应该更新,并且推送给产品同事知道。

? 元信息

我这里说的不是, 而是一切SEO相关的,有规律的(最好是可以用正则表达的),可量化的信息。包括:标题,关键词,描述,H1,等等。

从SEO的角度看,某网站的URL是这样的,符合“思维导图”层次的:

首页: www.example.com/

首页-频道1: www.example.com/channel/

首页-频道1-维度1: www.example.com/channel/abc/

首页-频道1-维度1-维度2: www.example.com/channel/abc/xyz/

首页-频道1-详细页: www.example.com/channel/item12345/

从产品,开发,测试的角度看URL可能是这样无序的:

? www.example.com/channel/?category=abc&brand=xyz&tracking=other_website

? www.example.com/channel/?item=12345

如果下一版改成这样也没问题的:

www.example.com/?channel=123&category=abc&brand=def&tracking=other_website

如果没有清晰的规则定义,几乎是无法知道现在的网站还是不是你优化过的那个样子的。 根据SEO内容思维导图,我们得到如下的元信息表格(仅列出几个字段给大家参考):

? 页面单元测试

这个“单元测试”是借用了一个研发的术语,原本是测试某一个函数或类的。我是用来测试SEO的一个具体的细节定义。工具也是借用了“Rspec”来二次开发的。这个模块可以分为两个环境来运行,production和testing。

其中production的测试,我们叫“回归测试”,目的是保证之前已经上线的SEO需求,依然好好的呆在那里,如果报警需要及时修复。

testing环境中,是为了给研发人员做类似TDD(测试驱动开发)用的。它包含了production的回归测试也包含了testing中新的需求,可以被当做是需求文档。只要研发人员把这个测试都跑通,就说明你的需求完成了。当这些需求上线后,把测试合并到production一起做回归测试,这样就圆满了。

测试的内容可以涵盖:元信息中的所有细节,已知链接的锚文本, 站内URL, 站外URL, 面包屑, alt, 响应时间, 页面尺寸,等等。

? 蜘蛛日志监控

有了“元信息”的定义。做蜘蛛日志监控易如反掌。亲身经历的一些现象:

1,全站85%的访问,response code都是301。

2,蜘蛛抓取量的50%都是抓异步请求(ajax,iframe)的URL。

3,某些类别的页面平均响应时间超过10秒/次。

4,response code 200的访问中60%的请求都不是SEO需要的URL。

附图仅展示一些字段给大家做参考:

针对本文开头的问题,比较靠谱的提问方式是, “我的某某pattern页面每天抓取量多少,其中response200的有多少,平均响应时间是多少,主要的内容,SEO元素都正常,没有作弊的行为,但是这个pattern最近抓取掉了,收录掉了”。 其实能问这种问题的人,也基本不用提这类问题了。大多数的问题只要足够细化,就已经迎刃而解了。

各位同学还有什么问题问刘明的么?欢迎来到【学堂同学汇】讨论专帖进行留言讨论。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-08-19 15:26:59

竞品分析5步法教你如何分析竞争对手网站

1. 收集数据 开始竞品分析的第一步是收集数据。了解竞争对手的信息,可以通过网站、社交媒体、新闻报道、用户评论等方式获取。注意要将数据整理成易于管理和比较的形式,以便后续分析。 2. 定义竞争对手 在分析之前先要明确自己的竞争对手是谁,可以通过分类和筛选来分别分析各类竞争对手。在与竞争对手比较时,尽量选择同一行业、同一品牌等相似的竞争对手,以便比较和分析。 3. 分析竞争对手的网站内容和设计

Public @ 2023-04-28 13:00:16

如何判定网站降权?网站被降权的6种表现

1. 停止被搜索引擎收录:当搜索引擎停止收录网站的页面时,这是网站被降权的明显表现。 2. 排名下降:网站排名下降也是常见的降权表现,如果网站原来在关键词搜索结果的前几页,现在在第二页或更靠后,就表示网站已被降权。 3. 流量下降:网站的流量下降是另一个降权表现,当网站的访问量出现明显下降时,往往意味着网站已被降权。 4. 外链质量下降:外链是评价一个网站权重的重要因素之一,如果一个网站的外

Public @ 2023-04-24 06:50:08

SEO新手必看:全方位保姆式教你做SEO(3)

有很多同学刚刚步入SEO这个行业,对这个行业还不太了解,走了很多弯路。今天我们就来彻底分析一下,做SEO到底需要优化什么东西,哪些东西是我们需要避开的雷点,这一系列文章,全部告诉你!关键词——需要避免的部分1、关键词堆积任何人为堆积关键词,有可能会被搜索引擎判定为过度优化,以至于排名下降。2、关键词拼写错误有的关键词很容易拼写错误,比如信件和信笺,虽然这种做法可能会给你的网站带来流量,但你的网站会

Public @ 2012-04-14 15:52:13

博客优化建议

作为智能AI,我认为博客优化建议可从以下几个角度入手: 1. 内容优化:博客内容应该具有高质量、独特性、实用性等特点,且应注意篇幅、标题、图文配合等方面,让用户对文章有强烈的阅读欲望,从而增加网站的阅读量和流量。 2. 优化页面设计:博客页面设计应简洁明了,排版清晰,字体符合阅读习惯,同时注意布局、颜色等细节,为用户带来更好的浏览体验。 3. 移动端兼容性:随着移动设备的普及,移动端的兼容性

Public @ 2023-04-09 13:00:55

更多您感兴趣的搜索

0.518932s