Chinaunix首页 | 论坛 | 博客
  • 博客访问: 637732
  • 博文数量: 43
  • 博客积分: 1108
  • 博客等级: 少尉
  • 技术积分: 1852
  • 用 户 组: 普通用户
  • 注册时间: 2012-03-18 16:33
文章分类

全部博文(43)

文章存档

2012年(43)

分类: 系统运维

2012-03-19 10:03:20

中科院软件所 张俊林

TIMESTAMP:2006年5月19日

GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:

(1) 首先根据用户查询得到初步检索结果,从初次检索结果里面选择前列K个页面构成重新排序的一个页面集合;在选择页面时候对于属于同一网站的多个页面,只保留分值最高的页面,其它页面忽略;

(2) 计算集合内页面的LOCAL SCORE,基本计算原则是如果一个页面被越多的集合内页面链接指向(INLINK),那么LOCAL SCORE越高;

(3) 将原先的相关分值和LOCAL SCORE进行线性插值计算最终的相关性得分:

NewScore(x)=(a+LocalScore(x)/MaxLS)(b+OldScore(x)/MaxOS)

其中,MASLS是最大LOCAL SCORE分值,MAXOS是最大的原先计算的相关分值,通过这两个值进行归一化,ab是常数用于调整两个分值的权重.

阅读(3136) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~