Categories


Tags


url上使用#号好不好

一般来说,url当中的#号是一个锚点的标志位,这样的url打开之后会将访问者的视线定位在指定位置上,令访问者直接看到网页中间的一段内容。自从推特流行开始,#号被附予了新的意义——话题。很多站长直接在#号后面加参数且参数是有效的,即#号去掉与不去掉,打开的网页完全不同。

目前百度对带#号URL的收录策略是:去掉#号后面的内容,仅对#号前面的url进行建库。这样就导致一些站长认为有意义有价值的页面,百度却无法收录,继而影响新链接的抓取和整体SEO效果。

所以站长在建站的时候对#号的使用一定要慎谨,百度站长平台不建议在有独特内容价值的url上使用#号。下面我们来看两个case:

case1:y.qq.com/#type=toplist&p=top_2

说明:百度仅对去掉“#type=toplist&p=top_2”后的y.qq.com进行抓取,导致爬虫获取到的页面与浏览器打开的页面不一致;优质页面无法收录,而且无法follow到该网页上的新链接。

case2:lvyou.baidu.com/changbaishan#/scene-remark-anchor

说明:虽然该url有着极优质的点评内容、用户可以通过访问该地址获得大量有用信息,但被百度建库的lvyou.baidu.com/changbaishanh并没有针对景点评论相关关键词进行优化,导致其很难在“长白山怎么样”之类的长尾query下有好的表现。除此之外,该页面所有点评内容都是通过JS异步加载实现的,导致百度根本不知道该页面上有这么优质的原创内容,这些内容自然也无法通过搜索引擎获得流量。

如果对URL的优化还有别的疑问,大家可以到[学堂同学汇][学习讨论] 《url上使用#号好不好》讨论贴中发表自己的看法,我们的工作人员会关注这里并与大家进行探讨。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-09-14 16:11:09

robots.txt文件有什么必要?

什么是robots.txt文件?搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。robots

Public @ 2018-10-22 16:09:22

robots

robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。来源:360站

Public @ 2014-01-16 16:09:19

网站URL显示品牌名字怎么弄

要在网站URL中显示品牌名字,可以遵循以下步骤: 1.在网站域名中包含品牌名称:你可以在域名中使用品牌名字来让它尽可能的出现在URL中。例如,如果你的品牌名称是“xyz”,你可以使用“xyz.com”作为域名。 2.使用自定义URL参数:如果你使用任何CMS(内容管理系统),例如WordPress或Joomla等,你可以使用自定义URL参数来修改URL中品牌名称的显示方式。这通常需要使用SEO

Public @ 2023-04-28 14:50:12

更多您感兴趣的搜索

0.644967s