普通的哈希算法暂且不讲了,我们探讨下哈希技术的各种应用。
1、一致性哈希,这个在分布式系统用途非常广泛。
2、局部敏感哈希LSH:simhash和minhash,key用于相似度检测等,谷歌有篇文章利用LSH进行网页去重。
3、布龙过滤器,判断一个元素是否在一个集合中。
4、在数据流算法中哈希算法应用更加广泛,比如数据流中独立元素计数等。
5、特征哈希,近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量,这里可以对minhash进行改进,比如b-bit minhash。
感谢原作者。
http://blog.csdn.net/dm_ustc/article/details/45569569
阅读(2187) | 评论(0) | 转发(0) |