Categories


Tags


为什么我的网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被搜狗收录?

sogou spider对网页的抓取,是通过网页与网页之间的链接实现的。

网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

搜狗Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被搜狗收录,原因有两点:

A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化。

B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。

如果您不希望这些私密性内容被搜狗收录,一方面可以通过robots协议加以限制;另一方面,也可以通过删除快照反馈给我们进行解决或者通过站长平台使用死链提交告知我们对其进行删除。


Public @ 2017-04-25 15:55:44

【官方说法】详谈百度快照前世今生

谈到百度快照,很多站长都很重视,快照的展示样式和内容也是站长们关注的重点;在过去一年中攻城狮们接收到很多站长的投诉反馈,主要集中在如下几个方面:1、快照的排版错乱问题,页面内容展示不全2、没有网页快照3、网页快照内容的更新问题4、网页已经死链,但快照仍然存在例如搜索『codercar.com』出来的百度快照截图,请注意红框部分的描述。这次学堂君请攻城狮来把百度快照的生成逻辑梳理下,详细给大家讲解下

Public @ 2011-09-09 15:34:25

如何让我的网页不被搜狗收录?

如果您希望您的网页不被搜狗搜索引擎收录,您可以尝试以下方法: 1. 使用robots.txt文件:在网站的根目录下创建一个名为robots.txt的文件,并在文件中添加以下内容: User-agent: Sogou Disallow: / 这将告诉搜狗搜索引擎不要访问和收录您的网站。 2. 使用META标签:在您的网页的头部添加以下META标签: 这将告诉搜索引擎不要索引这个特定的网

Public @ 2023-07-24 08:00:15

什么样的站点会受到搜狗欢迎?

站点应该是面向用户的,而不是面向搜索引擎的。一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;反过来,如果你的站点做了很多针对搜狗的优化,但却给用户带来大量负面体验,那么,你的站点最终肯定会受到搜狗的处罚。搜狗更喜欢有原创内容的网页,而不是简单抄袭和采集互联网上已有内容的网页。对于已经被重复了千百遍的内容,搜狗可能会不予收录。请谨慎使用你的站点链接。与一些垃圾站点做友情链接,很可能会使你的网站受到

Public @ 2016-02-29 15:55:42

更多您感兴趣的搜索

0.530231s