Categories


Tags


网站文章内链的一个思路

内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

传统方式

以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

在发布文章的时候,循环内链表内的所有,来替换文章的body。

这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

分析比较

一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

可行操作

我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

主动方式的实现方法如下。

利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

来源:读者沈力投稿

来源:月光博客


Public @ 2012-09-14 16:11:25

二级域名如何绑定一级目录

二级域名如何绑定一级目录1、在 DNS 域名管理后台域名转发里,设置二级域名转发至你的目标一级目录。2、提交后,在主机记录列表会添加一个你刚才提交的二级域名,其指向的IP地址与主域名不同。比如,新网互联指向的是:124.42.122.46。这个是正确的。3、不管你使用的虚拟主机,还是独立服务器。只要主域名可以正常访问即可,不需要在虚拟主机或独立服务器上再设置二级域名。二级域名如何绑定一级目录基础知

Public @ 2015-08-05 16:11:39

sitemap里有大量的转码链接,是否有影响?

问sitemap里爬出了心中链接,要将它改成静态的吗?使用sitemap工具,生成了sitemap,里面有大量的转码链接,这些链接都是tag页的。11-8.应该是TAG和html之间的这个应该是调用的什么东西,在浏览器里会变成中文。sitemap里不用改,这个可以吗?像这样 html结尾的,就是静态页面。在sitemap里,就是这个地址。  浏览器里是显示为中文E6%AF%8D%E5%A

Public @ 2020-06-01 16:09:51

5个方面制作好站内链接

站内链接的合理建设是SEO的重要技术之一,它的优化能使网站整体获得搜素引擎的价值认可,特别是百度。如何网站把站内链接做得足够好,能大大提升关键词在百度中的排名。下面卢松松讲从5个方面来说明如何建立站内链接。一:制作网站导航制作网站导航栏的注意事项有:第一,尽量使用文字链接;第二,不要使用JS调用方式,尽量使用CSS特效方式;第三,图片导航的ALT一定要加入说明;第四,导航名称一定要通俗易懂。关于网

Public @ 2018-06-21 16:11:26

网站内部链接策略

1. 链接分类 将链接分为主要链接和次要链接。主要链接包括页面的主要导航链接、重要内容页面链接等,次要链接包括页脚链接、侧边栏链接等。主要链接应该占据网站内部链接总数的绝大部分,次要链接数量较少。 2. 内部链接锚文本 内部链接锚文本应该描述被链接页面的内容,而非简单地使用诸如“点击这里”等通用词汇。这有助于提高页面的信息结构和搜索引擎的理解。 3. 内链关联 通过内链将相关页面的内容链

Public @ 2023-06-23 18:00:15

更多您感兴趣的搜索

0.622918s