Categories


Tags


为什么我的网站中的一些私密网页也会被百度收录?

Baiduspider对网页的抓取,是通过网页与网页之间的链接实现的。

网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

百度Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被百度收录,原因有两点:

  A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化

  B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容

如果您不希望这些私密性内容被百度收录,一方面可以通过Robots协议加以限制;另一方面,也可以通过反馈中心反馈给我们进行解决。


Public @ 2020-06-19 15:55:52

未建好页面应返回503状态码,防止被删除

近期,百度站长平台发现有一些网站把未建好的页面放到线上,并且这些页面在被百度抓取的时候返回码是404,于是页面被百度抓取后,会被当成死链直接删除。但是这个页面在第二天或者过几天就会建好,并上线到网站内展现出来,但是由于之前已经被百度当做死链删除,所以要再次等这些链接被发现,然后抓取,才能展现,这样的操作最终会导致一些页面在一段时间内不会在百度出现。比如某个大型门户网站爆出大量新闻时效性很强的专题未

Public @ 2015-09-15 15:35:42

为什么我的网站收录量下降?

原因一:搜狗策略更新调整,对于搜狗引擎来说,更新调整是必须的,这才能不断提高用户得到的搜索结果的质量,一般的更新调整对于质量正常的网站的流量和排名并不大,此时小幅度的下降并不影响大局;但是对于质量本身存在问题的网站,如大篇幅影响正文阅读的广告、涉及色情、涉枪涉暴、违法乱纪等网站,这类网站往往会被策略的更新调整直接影响,这种情况下站长需要坚持提升网站质量,坚持非恶意优化,才能重新获得好的收录。原因二

Public @ 2020-07-20 15:34:37

百度只收录首页不收录内页:

这种情况可能有多种原因。以下是可能导致百度只收录首页而不收录内页的原因: 1. 网站结构有问题:如果网站结构不合理,内部链接不足或者链接过于复杂,可能导致百度无法抓取到内页。 2. 内页质量不够高:百度会根据原创度、内容质量、页面质量等因素评估网页的价值,如果内页质量不够高,可能不会被收录。 3. 内页访问量不够高:如果内页的访问量不够高,百度可能不会将其优先收录。 4. 技术问题:如果网

Public @ 2023-04-10 16:50:46

如何让网站快速收录?网站提高收录的10种方法

1. 提交网站地图(Sitemap) 提交网站地图可以让搜索引擎更快速地发现和索引您的网站,提升收录率。 2. 做好内部链接 良好的内部链接可以加快搜索引擎对网站的索引速度,同时利用内部链接也可以提高页面权重,加强搜索引擎排名。 3. 好的内容 好的内容能够吸引用户,提供价值,让用户停留时间更长,也更容易被搜索引擎抓取和收录。 4. 外链建设 外链建设可以增加网站的流量和权重,并且能

Public @ 2023-06-26 20:50:27

更多您感兴趣的搜索

0.550849s