Chinaunix首页 | 论坛 | 博客
  • 博客访问: 915938
  • 博文数量: 453
  • 博客积分: 7865
  • 博客等级: 少将
  • 技术积分: 5673
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-29 16:21
个人简介

时光荏苒..

文章分类
文章存档

2015年(46)

2014年(22)

2013年(68)

2012年(218)

2011年(99)

发布时间:2015-03-04 09:53:12

转自: http://www.lanceyan.com/tag/simhash本文介绍 了需要海量对比汉明距离,使用的算法.如:需要进行100w次比较的情况下,如何进行 快速比对。......【阅读全文】

阅读(11413) | 评论(0) | 转发(0)

发布时间:2015-01-26 00:46:08

http://blog.csdn.net/hguisu/article/details/7962350http://blog.csdn.net/huangxiangec/article/details/8610472www.chedong.com/tech/lucene.html倒排索引主要由两个部分组成:“单词 词典”和“倒排文件”。单词词典内每条索引项记载单词本身的一些信息以及指向“倒排列表”的指针倒排列表记载了出现过某个单词.........【阅读全文】

阅读(1624) | 评论(0) | 转发(0)

发布时间:2015-01-23 11:37:35

点击(此处)折叠或打开package analyzer;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;i.........【阅读全文】

阅读(1077) | 评论(0) | 转发(0)

发布时间:2015-01-09 16:41:12

......【阅读全文】

阅读(1094) | 评论(0) | 转发(0)

发布时间:2015-01-07 16:04:04

转自:http://blog.csdn.net/lvxiangan/article/details/8151670一、编码历史与区别        一直对字符的各种编码方式懵懵懂懂,什么ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们。Let's go!  很久很久以前.........【阅读全文】

阅读(1777) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册