Categories


Tags


搜索引擎怎样判断文章或网页的原始出处?

复制内容网页有的时候会影响网页排名。

比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:

1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

3)域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4)网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

但到目前为止,无论以哪一个因素为主,或怎样组合这些因素,都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新,域名也很新,文章被收录的时间有的时候也不一定是最早的,就权威地位和被信任度来说,也肯定比不上很多中文网站。但我的博客新,我的域名新,并不意味着我的内容就不是原始出处,实际上我的所有博客都是原创。

我最近也发现了很多网站都转载,有的时候是抄袭我的博客内容,很多网站的规模,历史,PR值都比我的网站要高的多。

在检测文章原始出处方面,Google做的比较好,基本上能够正确判断,百度做的就比较差。从我的文章在不同的地方出现的情况看,百度似乎认为域名比较老的就是原创。

这个问题不是网站管理员自己可以解决的,只有依靠搜索引擎算法的改进。

来源:SEO每天一贴 Zac 昝辉


Public @ 2017-04-29 16:21:50

百度搜索引擎工作原理-3-检索排序

检索排序是指根据用户查询的关键词和相关度分数对文档进行排序,以便在搜索结果页面中将最相关和最相关的文档排在前面。百度搜索引擎使用了一种称为PBM(Probabilistic Boolean Model)的检索算法来衡量文档的相关性,以及PageRank算法来确定文档的权重和排名。 PBM算法将计算文档中包含用户搜索查询词的概率,并以此计算文档的相关度得分。这个概率是通过使用贝叶斯公式结合词频率、

Public @ 2023-06-16 04:00:39

怎样减少无效URL的爬行和索引 – 无完美解

少年老成的云晨守望同学(题外话:少年老成是好事哈。我20多岁时人家说我像40岁,我40多岁时好多人说我像30多,男人20到50岁可以做到基本一个样子)在网络营销实战密码网站贴了个帖子:透过京东商城看国内一线B2C网站SEO通病。建议先看那个帖子再回来看本帖,不然不容易明白下面在说什么。简单说,帖子指出一个严重而且现实的SEO问题:很多网站,尤其是B2C,产品条件过滤系统(如选择产品的品牌、价格、尺

Public @ 2009-09-07 16:21:51

搜索引擎分类

搜索方式是搜索引擎的一个关键环节,大致可分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,它们各有特点并适用于不同的搜索环境。所以,灵活选用搜索方式是提高搜索引擎性能的重要途径。全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式;元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式;垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式;目录搜索引

Public @ 2009-09-30 16:22:55

搜索引擎的用户是什么?

搜索引擎的用户是网络上的普通用户,他们需要通过搜索引擎找到所需的信息和资源。搜索引擎的用户涵盖了各行各业的人,包括学生、教师、企业家、科学家、政治家等不同的角色。他们使用搜索引擎进行学术研究、商业分析、娱乐消费、社交交流等多种活动。搜索引擎的用户还包括其他搜索引擎,这些引擎可能在进行数据挖掘、广告监测、竞争研究等领域有着广泛的应用。

Public @ 2023-06-15 04:50:09

更多您感兴趣的搜索

0.451913s