Categories


Tags


搜索引擎怎样抓到你?

用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。

前一阵在点石论坛上就看到关于在百度大量点击搜索结果中自己的网站,从而进一步提高排名的讨论。其逻辑是,搜索结果中的某个网站被点击次数越多,说明越有用,用户越喜欢,搜索引擎会更进一步提高这个网站的排名。

不过这种用户行为方式是噪声很大的数据,极容易作弊。搜索引擎要在这些数据中提炼出精华非常困难。

前几天Google员工JohnMu就在Google帮助论坛里明确说,诸如点击某个网站,然后立即点返回按钮,这种操作并不会影响你网站的抓取、索引和排名。这太容易作弊,太容易被竞争对手利用了。

类似这种看似很有价值,却又很难提炼有用信息的数据还很多。比如给竞争对手网站群发垃圾链接。

说到底,要有效利用用户行为数据,关键在于搜索引擎怎样确认用户身份,也就是说准确辨别特定行为到底是谁干的。如果是大量真实的用户点击你的网站,停留的时间很长,那么对排名一定有益。如果搜索引擎能判断出这大量点击就是你一个人,或者是与你有关的一群人干的,可能效果正相反。

给对手群发也是如此,关键在于判别是谁群发。

我以前写过一篇无所遁形,更多属于科幻和瞎想。但谁敢肯定有朝一日,在网上通过基因来判断身份不会实现呢?20年前,如果谁跟我讲会有互联网,会有网站,会有SEO,那时候我也会觉得是科幻。

现在搜索引擎其实已经掌握了大量的数据,能帮助鉴别用户身份。比如Google就可以通过cookies,JS脚本,工具条,gmail帐号,Adsense帐号,Google Analytics帐号,IP地址,用户搜索数据等判定和鉴别用户身份。

一个用户如果登录过gmail帐号,再访问任何带有Adsense,Google Analytics,以及Google所能控制的任何JS脚本的网页,这些访问数据都将被记录在案。而带有Google JS脚本的网站现在多如牛毛,除了明显的Adsense,Google Analytics等,现在Google还收购了最大的网络广告公司DoubleClick,无数有广告的网站都在使用Google的代码。所以你在网上的一举一动,很难逃过Google的眼睛。

如果安装了Google的工具条,那你访问网站的情况就更一目了然了。

就算你能极端洁身自好,不露痕迹,既不登录任何Google帐号,浏览器关掉JS脚本功能,也不用工具条。总之你就是个隐身人,也还是不能保证搜索引擎就抓不到你。

比如说,如果你通过一个联盟买卖链接,这是Google很痛恨的事情。就算你能做到隐身,但你无法保证这个联盟里的其他人都能不露痕迹。如果这个链接买卖联盟里面的一些人暴露了身份,而这些人时不时访问一下你的网站,检查他们所买的链接,你的网站和你自己也就露馅了。

觉得搜索引擎没有这么聪明吗?谁知道呢?小心为妙。

来源:SEO每天一贴 Zac 昝辉


Public @ 2015-05-11 16:21:51

百度搜索引擎工作原理-1-抓取建库

百度搜索引擎的工作原理首先是抓取建库,这是一个自动化的过程,百度通过多种方式来收集Web页面。百度拥有多台服务器,它们负责索引世界上大量的网站,以及持续的更新内容。 百度抓取网页的方式有两种,一种是爬虫,它们自动访问web页面,抓取那些有可能带有搜索关键字的页面;另一种是人工抓取,百度人工审查网页,将其记录到百度索引数据库中。 抓取到的网页都会放入百度索引库中,该库中包含了网页的具体内容、

Public @ 2023-03-02 00:00:21

搜索引擎是怎么删除重复网页的

搜索引擎是通过比较网页URL,内容和相关属性来删除重复网页的,具体步骤如下: 1. 搜索引擎收集器(Crawler)会在网络上发现新网页并收集,此时会有一定概率发现相同的网页,并添加到收集器的索引中去。 2. 收集器会识别新的网页,把重复的网页排除。 3. 然后,搜索引擎把新索引serves给布置在 Indexer(索引器)中,执行深入索引,会把相同内容的文章及URL排除,仅保留一条记录

Public @ 2023-02-24 23:12:24

搜索引擎工作原理

基本流程抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索

Public @ 2015-11-08 16:21:49

爬行和抓取

爬行和抓取 是搜索引擎工作的第一步,完成数据收集任务。1、蜘蛛:搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。2、跟踪链接:为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就好像蜘蛛在蜘蛛网上爬行那样,这也是搜索引擎蜘蛛这个名称的由来。3、吸引蜘蛛:理论上蜘蛛能爬行和抓取所有页面,但实际上不能,也不会这么做。SEO人员想要让

Public @ 2019-07-18 16:22:24

更多您感兴趣的搜索

0.402634s