Categories


Tags


语义分析、潜在语义索引和SEO

搜索引擎排名的基础之一,就是关键词与网页的相关性。

机器算法和人不一样的地方是人可以直接理解词的意思,文章的意思,机器和算法不能理解。人看到苹果这两个字就知道指的是那个圆圆的,有水的挺好吃的东西,搜索引擎却不能从感性上理解。

但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。

前些年SEO界很热烈地谈论过一阵潜在语义索引(Latent Semantic Indexing)。这是来自Google的一项专利,但申请了专利,不一定就会使用在真实算法中。 Google多次暗示,有时候比较明确表示,Google算法中实际没有应用潜在语义索引。但了解潜在语义索引的概念,我觉得对页面内容的写作是非常有好处的,所以还是写贴子介绍一下。

什么是潜在语义索引

所谓潜在语义索引指的是,怎样通过海量文献找出词汇之间的语义关系。当两个词或一组词大量出现在同一个文档中时,这些词之间就可以被认为是语义相关。共同出现概率越大,相关性越高。

举个例子,电脑和计算机这两个词在人们写文章时经常混用,这两个词在大量的文件中同时出现,搜索引擎就会认为这两个词是极为语义相关的,实际上这两个词的意思几乎一样,是同义词。

再比如,苹果和橘子这两个词也经常一起出现在很多文件中,这两个词既不是同义词也不是近义词,但搜索引擎根据共同出现的概率判断,这两个词是语义相关的。这两个词和水果这个词也很相关。这些判断显然都是符合实际情况的。

有时候两个词的相关性直觉看起来没有那么明显,甚至在人的逻辑上就没有什么关系,比如“杰克”和“轮船”,但很可能被搜索引擎判断为有一定的语义关系,因为会共同出现在电影泰坦尼克号介绍中。

要注意的是,潜在语义索引并不依赖于语言,所以SEO和搜索引擎优化虽然一个是英语,一个是中文,但这两个词大量出现在相同的网页中,虽然搜索引擎还不能知道搜索引擎优化或SEO指的是什么,但是却可以从语义上把”SEO”,”搜索引擎优化”,”search engine optimization”,”SEM”等词紧紧的连在一起。

搜索引擎有没有使用潜在语义索引,至今没有定论, Google还曾经否认。但一个事实是,2002年Google买下了拥有潜在语义索引专利的一家公司Allied Semantic。

这种语义分析技术可以给我们在SEO上一些提示。

网站主题的形成

通常逻辑和结构适当的网站都会分成不同的频道或栏目。在不同的频道中谈论有些区别但紧密相关的话题,这些话题共同形成网站的主题。搜索引擎在把整个网站的页面收录进去后,能够根据这些主题词之间的语义相关度判断出网站的主题。

网页内容写作

注意观察的话会发现,搜索排名有一个现象,搜索某个关键词,排在靠前面的网页有时甚至并不含有所搜索的关键词,这很有可能是潜在语义索引在起作用。

比如搜索电脑,排在前面的网页有可能出现一篇只提到计算机却没提到电脑。因为搜索引擎通过语义分析知道这两个词是一回事。

还有一个要注意的是,在进行网页写作的时候,不要局限于目标关键词,应该包含与主关键词语义相关、相近的词汇,以支持主关键词。设想一下,一篇讨论泰坦尼克号电影的文章,却没提到杰克,也没提到沉船,也没提到罗丝,也没提到小李子,也没提到爱情……那么这篇文章是怎么讨论泰坦尼克号的呢?还是有相当大的难度的。

这在搜索结果中也有体现,有的文章虽然大量出现主关键词,但缺少其他支撑词汇,排名往往不好。

来源:seo每天一贴 Zac 昝辉


Public @ 2015-03-13 16:14:11

竞品分析5步法教你如何分析竞争对手网站

1. 收集数据 开始竞品分析的第一步是收集数据。了解竞争对手的信息,可以通过网站、社交媒体、新闻报道、用户评论等方式获取。注意要将数据整理成易于管理和比较的形式,以便后续分析。 2. 定义竞争对手 在分析之前先要明确自己的竞争对手是谁,可以通过分类和筛选来分别分析各类竞争对手。在与竞争对手比较时,尽量选择同一行业、同一品牌等相似的竞争对手,以便比较和分析。 3. 分析竞争对手的网站内容和设计

Public @ 2023-04-28 13:00:16

30岁以后牢记这10条原则越混越好

1、两周剪一次头发2、给家里摆一盆花, 精心照顾3、不给亲戚朋友找工作和借钱4、趁早买房不要买3、4、7、10楼5、一有时间多锻炼身体常跑步7、一定要有一份稳定的副业8、长期用的东西一定要买贵的9、一定要找个好老师带自己进步10、要习惯孤独,无聊就看书学习11、有机会要做生意从小生意开始12、不熟悉的同事办喜事不去凑热闹13、攀比的同学朋友聚会宁可不参心来源:卢松松博客

Public @ 2020-09-15 15:33:00

防止博客文章被恶意转载的方法

所谓“恶意转载”,指的是一些不合常规和不文明的转载行为。包括批量的转载很多文章,通过程序自动转载,转载后删除署名或者原文的链接等等,很多博客都遇到过这种情况,大量的不注明出处的转载,会使得原创作者处于非常尴尬的处境,辛苦创作的文章得不到应有的回报。下面我就介绍一些针对这类恶意转载的应对措施。通过技术方式提醒增加这样一段JavaScript代码,当别人复制你文章内容的时候,系统会自动将版权信息和原文

Public @ 2018-02-25 16:17:28

搜索引擎优化项目的困扰

大部分人对搜索引擎优化这个概念还很陌生,可能名字现在很热门,但对它的理解恐怕很少人能比较清楚。甚至很多人对搜索引擎优化有很大的误解。所以,在接手和处理搜索引擎优化项目的时候,往往有很多烦恼。在和客户刚开始交流的时候,90%的情况都是首先要进行SEO基础知识扫盲教育。有的客户思维比较开放,比较能够接受。有的客户脑子里面却早就有了一套他自己的想法,很难改变。即使确认了项目,开始做真正的优化工作以后,也

Public @ 2021-10-31 16:14:04

更多您感兴趣的搜索

0.465291s