Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2085487
  • 博文数量: 249
  • 博客积分: 1305
  • 博客等级: 军士长
  • 技术积分: 4733
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-17 10:37
个人简介

不懂的东西还有很多,随着不断的学习,不懂的东西更多,无法消灭更多不懂的东西,那就不断的充实自己吧。 欢迎关注微信公众号:菜鸟的机器学习

文章分类

全部博文(249)

文章存档

2015年(1)

2014年(4)

2013年(208)

2012年(35)

2011年(1)

分类: C/C++

2015-09-20 23:35:04


    普通的哈希算法暂且不讲了,我们探讨下哈希技术的各种应用。
    1、一致性哈希,这个在分布式系统用途非常广泛。
    2、局部敏感哈希LSH:simhash和minhash,key用于相似度检测等,谷歌有篇文章利用LSH进行网页去重。
    3、布龙过滤器,判断一个元素是否在一个集合中。
    4、在数据流算法中哈希算法应用更加广泛,比如数据流中独立元素计数等。
    5、特征哈希,近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量,这里可以对minhash进行改进,比如b-bit minhash。
    

    感谢原作者。    
    http://blog.csdn.net/dm_ustc/article/details/45569569
阅读(2123) | 评论(0) | 转发(0) |
0

上一篇:Hadoop Streaming编程

下一篇:没有了

给主人留下些什么吧!~~