Chinaunix首页 | 论坛 | 博客
  • 博客访问: 70304
  • 博文数量: 33
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 185
  • 用 户 组: 普通用户
  • 注册时间: 2012-07-10 18:58
文章分类

全部博文(33)

文章存档

2012年(33)

分类:

2012-07-11 21:07:58

原文地址:simhash 作者:playmud

今天看了一下simhash,原理上就是bitmap的比较,当然精度上跟bitmap差一些,海明距离可以理解成不同元素的数量。其实google的东西大多数是为了google的应用场景搞出来,不一定适合其他场景。跟hadoop或者说bigtable不适合普通用户的场景一样,但是没办法,google是以技术见长的大公司,跟风者众~
当然google也有很多适合普遍场景的很多技术。
阅读(682) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~