Categories


Tags


【官方说法】详谈百度快照前世今生

谈到百度快照,很多站长都很重视,快照的展示样式和内容也是站长们关注的重点;在过去一年中攻城狮们接收到很多站长的投诉反馈,主要集中在如下几个方面:

1、快照的排版错乱问题,页面内容展示不全

2、没有网页快照

3、网页快照内容的更新问题

4、网页已经死链,但快照仍然存在

例如搜索『codercar.com』出来的百度快照截图,请注意红框部分的描述。

这次学堂君请攻城狮来把百度快照的生成逻辑梳理下,详细给大家讲解下为什么会出现这些问题,以及如何解决这些问题。

站长可以理解为百度快照的生成流程跟网页的索引更新是同步的,生成索引的同时会将爬虫最新一次抓取的网页内容推给快照生成程序。所以可以说网页建索引的速度决定了快照更新的速度。

快照生成模块会将网页内容通过浏览器展示给用户,目前快照展示模块只能根据静态的html进行网页渲染(行话是指通过iframe方式加载),所以对于一些相对路径下的js,css和图片等素材是无法进行加载的,或者部分网站禁用了百度域对js,css等文件的访问,都会导致快照展示出现排版错误和页面部分内容展示不全,对于这种情况站长可以根据实际需要进行整改。

对于没有快照信息的情况,也请站长不要紧张,这里只是没有针对该网页生成快照,并不是针对该网站进行了某些特殊处理。

另外站长投诉反馈最多的就是快照更新慢的问题,这涉及到快照更新的频率问题,不同的网页更新周期不一样,不同网站的网页更新频率也不一样,这里可以透露最长的更新周期是月级别,最短的更新周期是分钟级别。

对于涉及到敏感信息在百度快照上的更新问题,这里给广大站长推荐一个靠谱的方法,将涉敏感信息的网页做死链处理,然后在百度快照页面进行『投诉快照』处理;这个方法同样适用于『网页已经死链,但快照仍然存在』。

如何进行『快照投诉』,请参考历史文章《【大拿分享】快照错误或更新不及时如何向百度投诉》

来源:百度搜索资源平台 百度搜索学堂


Public @ 2011-09-09 15:34:25

什么样的网页会被百度认为是没有价值而不被百度收录?

百度只收录对用户有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:A.网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。B. 网页是复制自互联

Public @ 2018-08-31 15:55:50

屏蔽百度快照的方法

有时候,因为内容的更改或者隐私问题,我们往往不希望别人通过“百度快照”的方法查看自己网站的某一些网页,对于网站管理员来说,百度快照也分流了大量本属于网站的流量,为了增加网站的流量或者增强内容隐私,我以前曾经提供过一段将百度快照重定向到自己网站的方法。不过后来百度改变的快照算法,不从远端服务器获取JavaScript文件,因此先前介绍的那个屏蔽方法目前已经失效。现在我介绍一个新方法,原理也是大致相同

Public @ 2020-03-02 15:34:28

百度快照为什么会更新?

百度快照会更新是因为搜索引擎会定期抓取并更新网页的内容,当网页的内容发生了变化,搜索引擎会更新快照以反映最新的页面信息。同时,搜索引擎也会根据网页的更新频率和重要性等因素,对网页进行不同频率的抓取和更新,这也会影响到快照的更新。另外,如果网站使用了网站地图、RSS订阅等技术,也能够促进快照的更新。

Public @ 2023-04-04 18:00:10

更多您感兴趣的搜索

0.530305s