Categories


Tags


搜索引擎有多聪明?

使用黑帽SEO的人,心里或多或少都存在一个假设,那就是搜索引擎没自己聪明。在前几天的搜索引擎怎样判断垃圾留言这个帖子里,就有读者认为我把搜索引擎快说成神了。

我想很多人都会抱有这种想法,理由也很简单,搜索结果中含有大把大把的作弊网站,垃圾网站。如果搜索引擎真的那么聪明的话,这些网站怎么还会排名不错呢?

对搜索引擎到底有多聪明,今天谈谈自己的想法。

首先从常理上来说,主要搜索引擎内部的工程师,大多都是博士硕士,名牌学校的毕业生应该也是非常多。我当年上高中和大学时,数理化也算学的不错的。但我自问,能轻松考上和完成清华北大物理系或计算机系博士硕士课程吗?客观的说,够呛。我当年高考的分数够了清华的分数线,但并没报清华。那时候是先填报志愿,后考试。报志愿时哪知道考得怎么样呢。听说现在是先考试后报志愿?

无论如何,从自己大学四年生活判断,会继续读理工科研究生的可能性微乎其微。高数,概率论,电磁场…弄得人晕头转向。那些能考上,而且能完成名校理工科博士硕士学业的人,无疑是比我聪明的。我想他们也比大部分人聪明。

搜索引擎内部的很多人,我相信也都有自己的网站。他们本身就是站长,知道做网站的人都会有些什么花花肠子。我不清楚搜索引擎对掌握算法的工程师是否有禁止其运行自己网站的规定,不然很不公平。但是我想就算有这种规定,估计很多人参加搜索引擎公司之前就已经在做网站了。

一些黑帽手法也并不难了解。像Matt Cutts等人整天与站长社区沟通,参加所有的搜索引擎大会。Google一直鼓励用户举报垃圾网站。在各种SEO及站长有关的论坛中,我相信也都有搜索引擎的人在卧底。包括那些要付费的黑帽论坛和买卖链接网络。

我想99.9%的我们做网站的人能想到的黑帽手法,搜索引擎都知道。剩下那0.1%,应该是属于极聪明极另类的手法。聪明到那种地步的人恐怕也不会看我的博客了。

所以我一直坚信,千万不能假设搜索引擎不知道黑帽们耍的那些小花招。他们肯定知道。问题在于怎样以算法精确辨别黑帽手法?怎样采取行动,惩罚删除这些垃圾网站,却又不伤及无辜?这才是难点。

有几种以计算机为基础的人工智能可以和人的智能相比较。以记忆和大量统计为基础的智能,在这方面算法已远远超过人的能力。以逻辑推理为基础的人工智能,与人脑大致不相上下。以情感和形象思维为基础的人工智能,则还比不上人脑。

正因为如此,电脑可以在国际象棋方面,与人类中的最高手较量。但在围棋方面却还没达到这种程度,因为围棋有一种很玄妙的,以所谓形为基础的东西,高手往往从形就能直观判断形势和某一手棋的好坏,不需要计算。

对垃圾手段的鉴别,有一部分是以大量数据为基础,比如链接模式。但也有一部分是牵扯到情感和感性方面的,比如某句垃圾留言到底是有感而发,还是纯粹垃圾?机器的判断与真人相比,恐怕还有差距。

在我看来,所有的黑帽手法,搜索引擎都知道。搜索引擎之所以还不能完全清除这类垃圾网站,是还没找到不伤及无辜的方法。但今天不处理,未必意味着以后不处理。

我们一直在琢磨搜索引擎怎样判断付费链接,那几乎是不可能的。但从最近几个月Google对付费链接的处理上看,他们开始下手了。处理方式并不像我们想象的那样直截了当,似乎并没有对买卖链接的网站直接进行惩罚,而是将卖链接的网站PR值降低,甚至置零,从而摧毁有规模的链接买卖行业。

其他垃圾手法也同样。

做网站尤其是做SEO的人,心里要有这样的一个底线,就是,我的花活搜索引擎都知道,要想冒险就要做好心理准备,没被发现是命好,被发现不要怨天尤人,更不要装出无辜的样子。

来源:seo每天一贴 Zac 昝辉


Public @ 2009-07-02 16:22:40

新站建立后,需要多长时间能够被搜狗收录?

收录时间是根据您的网站质量、类型等综合因素考虑的。比如大型的新闻站、优质站点、地方优质门户网站,新站建立后能够达到秒级的收录;再往下一级的普通站点则需要天级;低质量站点的收录时间会达到周级以上甚至不保证收录。新站建立很长时间后,若未被搜狗收录,请到站长平台提交网站收录。来源:搜狗资源平台

Public @ 2011-04-09 15:34:38

从搜狗永久删除内容如何操作?

情况一网页已不存在如果网页已不存在,请确保服务器返回 404(未找到)。这样可让搜狗知道该网页已不存在,无需再在搜索结果中显示。情况二网页仍存在请使用 robots.txt 阻止 sogou spider 进行抓取。请注意,在通常情况下,即使您已通过 robots.txt 禁止抓取某个网址,但如果我们在其他网站中发现该网址,仍会将相应网页编入索引。这里需要说明一点,如果页面变死链了,并且设置了ro

Public @ 2017-12-20 15:35:24

搜索引擎对frame和iframe框架是否友好?

首先,Frame和iframe代码框架的意思是在当前页面中插入另一个页面,可以说是调用也可以说是使用代码插入。比方我们在的页面为a.html 对于a.html的页面我们存在不满意,但是为了达到某种目的。而再创建以个页面b.html 然后把b.html用js调用的方式或是其他div以及代码方式插入到a.html 。可以理解为b.html是当前页面中(a.html)的独立子页面,与父页面同时展示。需要

Public @ 2010-11-09 16:22:40

搜索引擎的用户是什么?

搜索引擎的用户是使用搜索引擎工具在互联网上查找信息、资源、产品、服务等的人群。这些用户可能是普通的网民、学生、教师、研究人员、业务人士、消费者等各行各业的人士,他们使用搜索引擎来获得信息、解决问题、满足需求、获取知识等。因此,搜索引擎的用户群体非常广泛。

Public @ 2023-04-06 16:50:13

更多您感兴趣的搜索

0.539300s