Categories


Tags


网站文章内链的一个思路

内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

传统方式

以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

在发布文章的时候,循环内链表内的所有,来替换文章的body。

这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

分析比较

一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

可行操作

我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

主动方式的实现方法如下。

利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

来源:读者沈力投稿

来源:月光博客


Public @ 2012-09-14 16:11:25

从SEO角度优化网站结构带来哪些好处?

1. 提高网站的可访问性:通过优化网站的结构,使搜索引擎能够更好地识别和索引网站的内容,进而提高网站的可访问性和搜索引擎排名。 2. 提升用户体验:一个良好的网站结构能够让用户更轻松地找到他们需要的信息,提升用户体验和满意度。 3. 促进网站增长:一个优化良好的网站结构能够提升网站内部链接的质量和数量,从而提升页面排名和网站的整体流量,促进网站的增长。 4. 降低跳出率:通过优化网站结构,使

Public @ 2023-06-02 14:00:25

不带www域名重定向到带www域名

在.htaccess文件中添加以下代码: RewriteEngine On RewriteCond %{HTTP_HOST} !^www\. RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L] 这段代码的作用是:首先打开Apache的重写引擎;然后检查HTTP_HOST是否已经是以"www."开头,如果不是,则执行下一行代码;最后执行

Public @ 2023-06-23 12:00:08

网站内链这样操作,有效提升网站用户的粘性,降低跳出率

做好网站内链优化,可以提升网站权重与关键词排名,但是内链优化建设也不能偏离用户体验,只有抓住用户需求,才能抓取用户的心,用户喜欢的网站,自然搜索引擎也会喜欢,对于网站优化者来说,除了内链,重要的还有网站内容质量,切勿直接抄袭。一、相关推荐或者推荐阅读这个模块是在网站内部很常见,一般都是在文章的底部,通过关键词把相关的内容匹配在一起,这样做的目的,不仅完善网站内部链接,还能有效降低客户跳出率,引导用

Public @ 2012-11-06 16:11:29

内部链接(站内链接)的优化

1. 使用有意义的链接文本:链接文本应该包含目标页面的主要关键词,同时尽量避免使用无意义的链接文本,比如“点击这里”或“了解更多”。 2. 建立链接深度:优化站点内部链接深度是提高网站排名和用户体验的关键。建立清晰的网站结构和层次,确保每个页面都可以通过几个点击以内到达。 3. 保证内部链接的稳定性:内部链接是网站的基础,因此要确保内部链接的持续稳定。当需要调整某些页面的链接时,尽量在网站上进

Public @ 2023-04-10 06:51:07

更多您感兴趣的搜索

0.648824s