Chinaunix首页 | 论坛 | 博客
  • 博客访问: 102094
  • 博文数量: 38
  • 博客积分: 2500
  • 博客等级: 少校
  • 技术积分: 420
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-20 21:05
文章分类

全部博文(38)

文章存档

2011年(1)

2010年(3)

2009年(22)

2008年(12)

我的朋友

分类: 系统运维

2010-04-11 11:24:10

关于PageRank
    PageRank,有效地利用了 Web 所拥有的庞大链接构造的特性。 从网页A导向网页B的链接被看作是对页面A对页面B的支持投票,Google根据这个投票数来判断页面的重要性。可是 Google 不单单只看投票数(即链接数),对投票的页面也进行分析。「重要性」高的页面所投的票的评价会更高,因为接受这个投票页面会被理解为「重要的物品」。
    根据这样的分析,得到了高评价的重要页面会被给予较高的 Page Rank(网页等级),在检索结果内的名次也会提高。PageRank 是 Google 中表示网页重要性的综合性指标,而且不会受到各种检索(引擎)的影响。倒不如说,PageRank 就是基于对"使用复杂的算法而得到的链接构造"的分析,从而得出的各网页本身的特性。
    当然,重要性高的页面如果和检索词句没有关联同样也没有任何意义。为此 Google 使用了精练后的文本匹配技术,使得能够检索出重要而且正确的页面。
 
    具体的算法是,将某个页面的 PageRank 除以存在于这个页面的正向链接,由此得到的值分别和正向链接所指向的页面的 PageRank 相加,即得到了被链接的页面的 PageRank。
 
    提高 PageRank 的要点,大致有3个。
    1. 反向链接数 (单纯的意义上的受欢迎度指标)
    2. 反向链接是否来自推荐度高的页面 (有根据的受欢迎指标)
    3. 反向链接源页面的链接数 (被选中的几率指标)
 
阅读(365) | 评论(0) | 转发(0) |
0

上一篇:远程显示X-window

下一篇:Ubuntu安装sun JDK

给主人留下些什么吧!~~