发布时间:2012-12-10 13:27:39
搜索引擎室一个计算机应用软件系统或者说是一个网络应用软件系统。从网络用户的角度看,它根据用户提交的类自然语言查询词或短语,返回一系列可能与该查询相关的网页信息,供用户进一步判断和选取。大致分为三个模块:网页搜集、预处理和查询服务。 基本要素:在一个可以接受的时间内返回一个和该用户查询匹配的网页信息列表记录为L 现代大规模高质量搜索引擎一般采用三段式工作流程:网页搜集、预处理和查询服务 大规模搜索引擎服务的急促应该是一批预先搜集好的网页。如定期搜集,每次搜集替换上一次的内容,称为批量搜集。 增量搜集,开始搜集一批,往后只是a、搜集新出现的网页。b、搜集有些在上次搜集后......【阅读全文】