Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1471819
  • 博文数量: 254
  • 博客积分: 8696
  • 博客等级: 中将
  • 技术积分: 2961
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-03 16:46
文章分类

全部博文(254)

文章存档

2015年(4)

2014年(18)

2013年(16)

2012年(8)

2011年(25)

2010年(2)

2009年(74)

2008年(107)

分类: 网络与安全

2011-04-13 21:47:34

                                  搜索引擎系统分类

搜索引擎技术类别

搜索引擎技术描述

目录式搜索引擎

以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中,由于web信息的海量性和人工处理能力、经济代价的限制,这类搜索引擎信息的即时性和全面性难以保证

机器人搜索引擎

由一个称为蜘蛛的机器人程序以某种策略自动地在因特网中搜集合发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户,这类搜索引擎实现较为复杂,但能很好地实现信息的全面获取和即时性

元搜索引擎

这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户,这类搜索引擎集合了多个搜索引擎的信息,并且加入新的排序和信息过滤,可以很好地提高用户满意度

机器人搜索引擎是目前主流的技术,它的实现包括3个关键点:利用网络蜘蛛获取网络资源、利用索引器抽取信息并建立索引表和检索及用户交互。

搜索引擎的评价指标主要包括响应时间、查全率、查准率和用户满意度等。

 

P2P网络搜索技术

网络类型

技术特点及代表系统

集中式P2P网络

集中式P2P网络通过一个中心服务器来记录共享信息以及回答对这些信息的查询,每一个对等实体负责共享它的信息,下载它所需要的存储在其它对等实体上的信息。这种信息具有中心化的特点,但它不同传统上的client/server模式。所有信息都分别存放在提供该信息的客户端上,服务器只保留索引信息,此外服务器与对等实体以及对等实体之间都具有交互能力。这类网络代表系统是NapstereMule

结构化分布式P2P网络

结构化分布式P2P网络是一种纯P2P网络。这种网络不需要有中心服务器和中心路由器,其上每一个peer都作为对等实体,地位完全平等的。每一个peer既可以作为客户端又可以作为服务器,并且它们与相邻的peer有相同的能力。这类网络中每个peer被分配一个虚拟地址,同时用一个关键字来表示其可以提供的共享内容。网络中各个节点分别存储自己的虚拟地址路由表进行路由。关键字存储在与关键字匹配的虚拟地址上。资源定位的时候,可以通过虚拟地址路由表快速查询到存储关键字的节点,从而获取共享内容的存储位置。这类网络的代表系统是ChordPastryCANTapestryKademlia

非结构化分布式P2P网络

非结构化分布式P2P网络和结构话分布式p2p网络一样,也是一种纯P2P网络,只是在网络拓扑结构上有所不同。这类网络中每个节点都拥有自己的邻居(peer-group)。查询文件时,节点向自己的所有邻居发送查询数据包。每一个收到查询数据包的节点将检查在自己本地存储的文件是否满足查询要求。如果满足的话,该节点发送一个查询响应数据包给查询的初始发起者,节点间直接交换文件。不管满足与否,该用户都继续将查询数据包向自己的邻居节点转发。以此类推,查询消息像洪水(Flood)一样在网络中流动。这类网络的代表系统是Gnutella

混合式P2P网络

混合式P2P网络是集中式P2P网络和分布式P2P网络的集合。集中式P2P网络有利于网络资源的快速检索。以及只要服务器能力足够强大就可以无限扩展,但是其中心化的模式容易遭到直接的攻击;分布式P2P网络具有良好的抗击性,但是又缺乏快速搜索的能力和扩展性。混合式P2P网络在分布式网络的基础上,将节点按能力进行分类,使某些节点担任特殊的任务,称之为超级节点,超级节点分担了网络大部分的检索、路由和扩展功能,使普通节点的负载下降。这类网络的代表系统是Skype

 参考:P2P网络技术原理与C++开发案例》

阅读(728) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~