深蓝苹果kakablue.blog.chinaunix.net
深蓝苹果
全部博文(87)
2012年(49)
2011年(7)
2010年(26)
2009年(5)
曾德标
聆音听墨
阿4is痞
zy_chang
shanggua
点点未来
zyd_cu
咩羊。
embededg
qinjianb
yaoli041
huandala
mich_mq
redman27
风际的云
wansuiye
ynchnlui
莫不言
分类: Java
2012-03-28 18:19:58
标准分词器的三部分结构
1.构建器
从无参数---有参数---文件读入参数---reader流输入参数等各种构建器(加载停用词表)
2.Filters
各个filters逐个过滤
如:StandarFilters ---> LowerCaseFilter ---> StopFilter(带有一个stop words表的过滤器)
3.返回
返回一个TokenStream对象
这个Token流可以输出或写入文件
上一篇:linux 系统监控用命令
下一篇:[web分析]用户分布
3783335812012-03-30 01:13:45
进来看看……
登录 注册