2012年(43)
分类: 系统运维
2012-03-19 10:03:20
中科院软件所 张俊林
TIMESTAMP:2006年5月19日
GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:
(1) 首先根据用户查询得到初步检索结果,从初次检索结果里面选择前列K个页面构成重新排序的一个页面集合;在选择页面时候对于属于同一网站的多个页面,只保留分值最高的页面,其它页面忽略;
(2) 计算集合内页面的LOCAL SCORE,基本计算原则是如果一个页面被越多的集合内页面链接指向(INLINK),那么LOCAL SCORE越高;
(3) 将原先的相关分值和LOCAL SCORE进行线性插值计算最终的相关性得分:
NewScore(x)=(a+LocalScore(x)/MaxLS)(b+OldScore(x)/MaxOS)
其中,MASLS是最大LOCAL SCORE分值,MAXOS是最大的原先计算的相关分值,通过这两个值进行归一化,a和b是常数用于调整两个分值的权重.