Categories


Tags


百度搜索引擎工作原理-5-结果展现

结构化数据——助力站点获得更多点击

网页经历了抓取建库,参与了排序计算,最终展现在搜索引擎用户面前。目前在百度搜索左侧结果展现形式很多,如:凤巢、品牌专区、自然结果等,一条自然结果怎样才能获得更多的点击,是站长要考虑的重要一环。

目前自然结果里又分为两类,见下图,第一个,即结构化展现,形式比较多样。目前覆盖80%的搜索需求,即80%的关键词下会出现这种复杂展现样式;第二个即一段摘要式展现,最原始的展现方式,只有一个标题、两行摘要、部分链接。

很明显,结构化展现能够向用户明确传递信息,直击用户需求痛点,获得更好的点击自然不在话下。目前结构化展现有几个样式:

1,  通用问答:提取答案,方便搜索用户参考,有些结构化数据还提取出了问题

2,  下载:

3,时间戳:对于时效性较强的资讯,将时间提取出来,吸引用户点击,还有回复的条目,能够表现这个链接的有效性和热度

4, 在线文档:出现文档格式示意图

5,原创标记: 原创标记的使用是最严格的,只有通过人工审核的站点才能拥有原创标志,在抓取和排序上有一定优待,所以审核非常严格,严控质量。

6,配图:扩大面积,方便用户了解网页内容,吸引点击

那么站长可以通过什么途径获得结果化展现呢:

1,参与原创星火计划:百度站长平台VIP俱乐部提供申请入口,需要经过人工审核后进行数据提交

2,结构化数据提交工具:zhanzhang.baidu.com/wiki/197

3,结构化数据标注工具:/itemannotator/index

4,搜索结果配图:具体要求为,在文章主体位置;图片与内容相关;图片上没有文字;图片比例接近121*91

来源:百度搜索资源平台 百度搜索学堂


Public @ 2021-09-11 16:21:45

搜索引擎网页去重算法分析

相关统计数据表明:互联网上近似重复的网页的数量占网页总数量的比例高达29%,完全相同的网页大约占网页总数量的22%.研究表明,在一个大型的信息采集系统中,30%的网页是和另外70%的网页完全重复或近似重复的。即:互联网的网页中相当高的比例的网页内容是近似相同或完全相同的!搜索爬虫抓取会产生网页重复的类型:1.多个URL地址指向同一网页以及镜像站点如:www.sina.com 和www.sina.c

Public @ 2020-07-15 16:21:55

百度搜索引擎工作原理-4-外部投票

外部投票是指其他网站通过链接引导用户来到被投票网站的行为。在搜索引擎的工作原理中,外部投票是非常重要的因素之一,因为搜索引擎将其视为其他网站对被投票网站的认可和推荐。 外部投票的数量和质量对搜索引擎的排名影响非常大。如果一个网站拥有高质量的外部投票,那么搜索引擎就会认为这个网站是一个权威和受欢迎的网站,排名会相应提高。相反,如果一个网站的外部投票数量和质量很差,搜索引擎就会认为这个网站不值得被推

Public @ 2023-04-21 22:50:31

百度搜索引擎工作原理

最新更新章节:2019-03-04关于百度以及其它搜索引擎的工作原理,其实大家已经讨论过很多,但随着科技的进步、互联网业的发展,各家搜索引擎都发生着巨大的变化,并且这些变化都是飞快的。我们设计这个章节的目的,除了从官方的角度发出一些声音、纠正一些之前的误读外,还希望通过不断更新内容,与百度搜索引擎发展保持同步,给各位站长带来最新的、与百度高相关的信息。本章主要内容分为四个章节,分别为:抓取建库;检

Public @ 2014-04-22 16:21:48

百度搜索引擎工作原理-3-检索排序

检索排序是指根据用户查询的关键词和相关度分数对文档进行排序,以便在搜索结果页面中将最相关和最相关的文档排在前面。百度搜索引擎使用了一种称为PBM(Probabilistic Boolean Model)的检索算法来衡量文档的相关性,以及PageRank算法来确定文档的权重和排名。 PBM算法将计算文档中包含用户搜索查询词的概率,并以此计算文档的相关度得分。这个概率是通过使用贝叶斯公式结合词频率、

Public @ 2023-06-16 04:00:39

更多您感兴趣的搜索

0.417062s