Categories


Tags


搜狗spider的IP有哪些?

搜狗暂不对外提供搜狗spider IP列表,但您可以通过DNS反查IP的方式判断某只spider是否来自搜狗搜索引擎。根据不同平台有不同的验证方法。

linux平台:

命令为host ip,如下图。搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。

在windows平台或者IBM OS/2平台:

命令为nslookup ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。

mac os平台:

命令为dig ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。

来源:搜狗资源平台


Public @ 2015-03-01 15:38:50

如何让 sogou spider 不抓我的网站

您可以在网站的 robots.txt 文件中添加以下内容,来阻止 Sogou 蜘蛛抓取您的网站: User-agent: Sogou Disallow: / 这会告诉 Sogou 蜘蛛不要访问您的整个网站。如果您只想阻止蜘蛛访问特定页面或目录,可以将 Disallow: / 替换为您想要屏蔽的 URL。例如: User-agent: Sogou Disallow: /admin/ Disal

Public @ 2023-06-25 03:00:11

sogou spider 喜欢收录什么样的页面

内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。来源:搜狗资源平台

Public @ 2021-05-15 15:38:49

为什么我的网站已经加了robots.txt,还能在搜狗搜索出来

因为搜索引擎索引数据库的更新需要时间。虽然sogou spider已经停止访问您网站上的网页,但搜狗搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过删除快照反馈请求处理。

Public @ 2018-01-11 15:38:56

更多您感兴趣的搜索

0.426932s