Categories


Tags


屏蔽百度快照的方法

有时候,因为内容的更改或者隐私问题,我们往往不希望别人通过“百度快照”的方法查看自己网站的某一些网页,对于网站管理员来说,百度快照也分流了大量本属于网站的流量,为了增加网站的流量或者增强内容隐私,我以前曾经提供过一段将百度快照重定向到自己网站的方法。不过后来百度改变的快照算法,不从远端服务器获取JavaScript文件,因此先前介绍的那个屏蔽方法目前已经失效。

现在我介绍一个新方法,原理也是大致相同,我们知道目前百度网页快照虽然不从远端服务器抓取JavaScript文件,还是依旧会从远端服务器抓起CSS文件,而通过一个技巧可以在CSS文件中实现网页重定向,从而控制百度快照中的网页,完全由我们控制该快照重定向到我们制定的任何网页地址。

例如,如果百度快照中缓存的文件为style.css,那么我们在服务器上编辑这个文件,在CSS文件中加入以下语句,即可控制百度缓存快照重定向,从而实现屏蔽百度网页快照内容的功能。

body {onload:expression(location.href='https://www.williamlong.info/');}

以上语句在IE浏览器下测试通过。理论上,根据这个方法,我们可以控制百度网页快照的内容重定向到任何一个我们指定的网址,甚至是第三方网站。为了实现网页的正常显示,百度快照屏蔽CSS的可能性会非常小。

这个方法也可用于屏蔽Google等其他搜索引擎的网页快照。

来源:月光博客


Public @ 2020-03-02 15:34:28

百度快照为什么会更新?快照时间为什么会倒退

百度快照:指的是网站上被收录的页面,都在百度上的纯文本里备份。网页的抓取频率和快照的更新频率是两个不同的概念。被百度收录的网站,蜘蛛会根据该站点内容更新的频率,频繁的来站点检查是否有新的网页生成,蜘蛛的抓取频率会和网站产生新内容的速度相符,这个就叫蜘蛛对网页内容的抓取。百度快照自动更新原理:1、网站上被新抓取的页面或者是新检查过的网页,蜘蛛都会根据页面的价值性以及时效性的不同创建索引,快照更新时间

Public @ 2016-01-04 15:34:31

百度快照为什么会更新?快照时间为什么会倒退

百度快照:指的是网站上被收录的页面,都在百度上的纯文本里备份。网页的抓取频率和快照的更新频率是两个不同的概念。被百度收录的网站,蜘蛛会根据该站点内容更新的频率,频繁的来站点检查是否有新的网页生成,蜘蛛的抓取频率会和网站产生新内容的速度相符,这个就叫蜘蛛对网页内容的抓取。百度快照自动更新原理:1、网站上被新抓取的页面或者是新检查过的网页,蜘蛛都会根据页面的价值性以及时效性的不同创建索引,快照更新时间

Public @ 2016-01-04 15:34:31

快照时间为什么会倒退?

一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。这对网站在搜索引擎中的表现无任何影响,也并不代表搜索引擎对该网站做了降权处理。综上,快照的更新与页面中是否出现重要新增内容有直接关联,而与网站本身的“权重”、是否“被K”并无直接关联。站长不必过多关注网站的快

Public @ 2020-05-25 15:34:25

更多您感兴趣的搜索

0.654094s