Categories


Tags


搜索引擎面临哪些问题

网页时效性:互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。  

大数据存储问题:爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。当前大部分搜索引擎都是利用结构化的数据库来存储数据,结构化的数据库存储的数据具有高共享、低冗余等特点,然而由于结构化的数据库难以并发查询所以存在查询效率受限的问题。  

检索结果可靠性:目前由于数据挖掘技术以及计算机硬件的限制使得数据处理准确度未能达到理想程度,而且由于一些个人或公司利用搜索引擎现有的漏洞通过作弊手段来干扰检索结果导致检索结果的可靠性可能会有损失。


Public @ 2013-08-22 16:22:54

新站建立后,需要多长时间能够被搜狗收录?

收录时间是根据您的网站质量、类型等综合因素考虑的。比如大型的新闻站、优质站点、地方优质门户网站,新站建立后能够达到秒级的收录;再往下一级的普通站点则需要天级;低质量站点的收录时间会达到周级以上甚至不保证收录。新站建立很长时间后,若未被搜狗收录,请到站长平台提交网站收录。来源:搜狗资源平台

Public @ 2011-04-09 15:34:38

搜索引擎分类

搜索方式是搜索引擎的一个关键环节,大致可分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,它们各有特点并适用于不同的搜索环境。所以,灵活选用搜索方式是提高搜索引擎性能的重要途径。全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式;元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式;垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式;目录搜索引

Public @ 2009-09-30 16:22:55

搜索引擎发展历程

搜索引擎发展历程可以概括为以下几个阶段: 1. 早期搜索引擎(1990年代中期至2000年) 早期搜索引擎主要以Yahoo!, Altavista, Infoseek等为代表,这些搜索引擎主要通过手动编辑和分类来整理互联网上的网站信息,然后利用关键词检索和匹配算法返回结果。 2. 搜索引擎优化(2000年至2005年) 在早期搜索引擎的基础上,出现了搜索引擎优化(SEO)技术。通过对网站内

Public @ 2023-06-12 09:00:28

更多您感兴趣的搜索

0.445010s