Chinaunix首页 | 论坛 | 博客
  • 博客访问: 253944
  • 博文数量: 21
  • 博客积分: 1263
  • 博客等级: 准尉
  • 技术积分: 697
  • 用 户 组: 普通用户
  • 注册时间: 2012-03-24 00:05
个人简介

专注于Answers Ranking, Answer Monitor和log处理。

文章分类
文章存档

2014年(5)

2012年(16)

分类: 大数据

2014-04-01 22:39:00

今天小组开会的时候说了answer 与algo相似的问题的,到底哪个看上去更好呢?我个人是偏向于answer的,answer带的信息更多,但是对于搜索结果来说,太多的重复结果到对用户来说是不是真的很好,这个问题确实值得我们进行探讨。

到底是否需要对搜索结果进行去重呢?而去重的依据又是什么呢?就算algo里有重复的内容,来自不同的大站,我们怎么决定对哪个站进行过滤?这个明显是不合理,就像如果新闻里出现了大事,网易,新浪等各大门户都进行报道,新浪是第一个algo,网易是第二个algo,但是他们的内容完全相同,不同的用户喜欢可能会对此造成影响,但如果algo的来源有保证的话,大部分点击应该会出在上面。而answer的出现让用户有更多的选择的同时,也加重了这种重合率,但answer的结果就是猜用户想要的,而这种answer可以说就是用户需要的,为什么要dedup掉?否则answer的意义又在哪?
阅读(4993) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~