百度搜索算法规范详解-1-引言
百度搜索算法是百度搜索引擎为了更好的实现用户查询意图,提供最精准的查询结果,而进行的一系列的算法处理。根据用户的查询意图,百度能够匹配出最接近的查询结果,达到搜索更加广泛,结果更加精准的目的。 百度搜索算法主要有索引算法、聚类算法和拼写检查算法等。索引算法是百度搜索引擎的核心算法,它能够在搜索引擎无限索引大量信息后,根据查询意图将索引结果按照词频、普及率和用户点击率排序返回到用户搜索结果中。聚类算法是百度能够实现垂直搜索的核心算法,它的目的是对同一类查询意图的生动描述,将一块专业领域的大量信息进行精确分类,分散到每一个子分类中,形成垂直搜索结果。拼写检查算法是百度提供更加友好的搜索结果的核心算法,它能够根据用户查询时输入错误的单词,改正用户查询意图,通过对历史搜索记录,语言模型等技术返回更加精准的搜索结果。