Categories


Tags


【官方说法】详谈百度快照前世今生

谈到百度快照,很多站长都很重视,快照的展示样式和内容也是站长们关注的重点;在过去一年中攻城狮们接收到很多站长的投诉反馈,主要集中在如下几个方面:

1、快照的排版错乱问题,页面内容展示不全

2、没有网页快照

3、网页快照内容的更新问题

4、网页已经死链,但快照仍然存在

例如搜索『codercar.com』出来的百度快照截图,请注意红框部分的描述。

这次学堂君请攻城狮来把百度快照的生成逻辑梳理下,详细给大家讲解下为什么会出现这些问题,以及如何解决这些问题。

站长可以理解为百度快照的生成流程跟网页的索引更新是同步的,生成索引的同时会将爬虫最新一次抓取的网页内容推给快照生成程序。所以可以说网页建索引的速度决定了快照更新的速度。

快照生成模块会将网页内容通过浏览器展示给用户,目前快照展示模块只能根据静态的html进行网页渲染(行话是指通过iframe方式加载),所以对于一些相对路径下的js,css和图片等素材是无法进行加载的,或者部分网站禁用了百度域对js,css等文件的访问,都会导致快照展示出现排版错误和页面部分内容展示不全,对于这种情况站长可以根据实际需要进行整改。

对于没有快照信息的情况,也请站长不要紧张,这里只是没有针对该网页生成快照,并不是针对该网站进行了某些特殊处理。

另外站长投诉反馈最多的就是快照更新慢的问题,这涉及到快照更新的频率问题,不同的网页更新周期不一样,不同网站的网页更新频率也不一样,这里可以透露最长的更新周期是月级别,最短的更新周期是分钟级别。

对于涉及到敏感信息在百度快照上的更新问题,这里给广大站长推荐一个靠谱的方法,将涉敏感信息的网页做死链处理,然后在百度快照页面进行『投诉快照』处理;这个方法同样适用于『网页已经死链,但快照仍然存在』。

如何进行『快照投诉』,请参考历史文章《【大拿分享】快照错误或更新不及时如何向百度投诉》

来源:百度搜索资源平台 百度搜索学堂


Public @ 2011-09-09 15:34:25

什么样的网页会被百度认为是没有价值而不被百度收录?

百度只收录对用户有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:A.网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。B. 网页是复制自互联

Public @ 2018-08-31 15:55:50

百度如何搜索繁体字的相关内容?

百度提供的中文搜索服务会根据用户所在地区常用的文字格式进行转换,如果您所在地区的常用文字是中文简体,那么在输入中文繁体字进行搜索后,会将搜索词自动转换为相应的中文简体格式。您也可以在高级搜索设置中选择语言自行设置。

Public @ 2019-07-28 16:23:14

【官方说法】详谈百度快照前世今生

百度快照是百度搜索引擎的一个重要功能,它可以将网页在被百度抓取时的状态保存下来,并在搜索结果页面中展示。用户可以通过查看快照来了解网页内容的更新情况和变化。 在过去,百度快照经常被用于反映网站的收录和排名情况。但随着搜索引擎算法的不断升级,快照的重要性已经逐渐减弱,更多的是作为一种参考资料来被使用。 同时,百度也对快照做了一些改进和优化,如提升了快照的更新速度、增加了网页快照的存储空间等,以提

Public @ 2023-06-24 10:00:11

快照时间为什么会倒退?

一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。这对网站在搜索引擎中的表现无任何影响,也并不代表搜索引擎对该网站做了降权处理。综上,快照的更新与页面中是否出现重要新增内容有直接关联,而与网站本身的“权重”、是否“被K”并无直接关联。站长不必过多关注网站的快

Public @ 2020-05-25 15:34:25

更多您感兴趣的搜索

0.569635s