我希望我的网站内容被百度索引但不被保存快照,我该怎么做?
Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。
和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。
Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。
和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。
1. 在Robots.txt文件中添加抓取禁止索引指令:User-agent: Baiduspider ,Disallow: / 2. 在网站抓取反馈页面中禁止百度抓取:yu 抓取反馈页面 -> 新建反馈 -> 选择不抓取,并选择“所有搜索引擎” 3. 使用noindex标签,添加noindex标签meta可以明确地告知搜索引擎不抓取你的页面:
可能是因为您的私密网页在被收录之前没有被正确地设置为不被搜索引擎收录。您可以通过添加robots.txt文件或使用meta标签来告诉搜索引擎不要收录您的私密网页。另外,您还可以使用基于权限的访问控制方法,如密码保护或IP限制,来确保只有授权用户可以访问您的私密网页。
Baiduspider的user-agent是: Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
建议您使用DNS反向查找和DNS正向查找相结合的方式来确定抓取来源的ip是否属于百度,根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下: 6.1 在linux平台下:(1)使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.b