Categories


Tags


【院长帮帮忙】第四期:URL构成越简单越平常越好

SEO不是事后工作,在站点在建设之初就要考虑到如何对搜索引擎友好。在院长看来,与其出手阔绰、花大价钱买个域名,不如找个经验丰富的SEO人员在站点结构等基础工作上多下工夫——这期院长帮帮忙,说的正是一个大家容易忽略的细节问题:url构成。先说结论吧:url构成(或者叫url规则)越简单越平常,百度处理起来越顺畅,越容易正确生效。

院长收到的case是这样的,站长反应:跳转适配的PC页和移动页,内容可以做到一一对应,通过移动适配工具提交了规则适配,但一直无法正确生效。

示例链接:http://www.123456.cn/zjj/teacher/p1ll111001

示例正则式:

http://www.123456.cn/(\w+)/teacher/p1ll(\d+)——

http://m.123456.cn/teacher/${1}/s${2}

院长在检查了页面对应的确无误的情况下,请工程师查看,结论如下:移动适配部门在计算PC站点的pattern(规则)时,分割符没有考虑ll,导致计算出的数据有问题。简单说,此站点每个URL中都出现的、极少有网站使用的ll干扰了适配计算,导致适配无法正确生效。

工程师解释说,“在考虑分隔符时,出于成本的考虑,只顾及到了常见的url分隔符,像ll这种非常罕见的,暂时没有考虑,后续升级时再统一安排。

可能很多同学觉得,单从这个case讲是百度的一个badcase——我个人也承认这一点。但大家应该都知道,世上没有十全十美的策略,任何一个接近完美的策略都是不断迭代的结果。在我们日常的生活和工作中,也往往都会利用“最小成本获得最大收益”的思维来解决问题,百度的工程师也不例外。所以请给我们的策略一些时间,同时建议大家在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2016-05-05 15:22:03

360搜索对Robots协议的扩展

360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。在命令中可以使用*、$等通配符。示例:

Public @ 2019-02-15 16:09:33

新手如何掌握制作和提交网站地图?

如果你是一个新手,以下是建议: 1. 了解什么是网站地图(Sitemap) 网站地图(Sitemap)是指一份关于网站上页面、内容和其他重要信息的清单。它可以帮助搜索引擎更好地了解并索引您的网站。 2. 确定您的网站地图的结构 通过选择您的网站地图结构,您可以确定哪些页面是最重要的,并确定它们的层次结构。一旦你确定了这个结构,你可以依次列出所有这些页面。 3. 制作网站地图 一旦你确定

Public @ 2023-04-20 17:50:29

页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!站点求助:现象编织汇网站内容发布后几个礼拜都未曾收录。案例如下:http://www.bianzhihui.com/t/6717(教程详细页

Public @ 2014-01-01 15:22:05

【院长帮帮忙】网站被黑,到底是谁的责任?(第九期)

很多网站会突然找院长反馈,说网站突然出现了很多奇怪的页面,虽然域名是自己网站的,但是内容都不是网站发布的,而且一般都是赌博等内容;或者还有站长反馈,百度抓了自己网站的好多内容,而且这些内容都是博彩内容,但是网站并没有这些啊,百度出什么问题了?要求百度尽快处理问题!关于以上的这些问题,曲曲小姐姐再次给大家强调一下。如果网站突然出现大量的赌博等内容,这是网站被黑了啊,这肯定是网站自己的问题引起的,也只

Public @ 2014-01-07 15:22:07

更多您感兴趣的搜索

0.418148s