Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2429859
  • 博文数量: 392
  • 博客积分: 7040
  • 博客等级: 少将
  • 技术积分: 4138
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-17 13:03
个人简介

范德萨发而为

文章分类

全部博文(392)

文章存档

2017年(5)

2016年(19)

2015年(34)

2014年(14)

2013年(47)

2012年(40)

2011年(51)

2010年(137)

2009年(45)

分类: Java

2013-03-27 19:16:04

在代码的主目录下添加如下文件:



IK Analyzer扩展配置
extwords.dic
stopword.dic

这里指明要加载当前目录下的stopword.dic文件,作为扩展停用词,加载当前目录下的extwords.dic文件,作为扩展词典

IK代码如下,在执行new IKSegmenter的时候会自动初始化扩展词典:


点击(此处)折叠或打开

  1. StringReader reader = new StringReader(str);
  2.         IKSegmenter ik = new IKSegmenter(reader, true);
  3.         Lexeme lexeme = null;
  4.         int pos = 0;
  5.         String wordName = null;
  6.         
  7.         //System.out.println("into makeTagReal:" + str);

  8.         inital();

  9.         String splitLine = "";
  10.         try {
  11.             while ((lexeme = ik.next()) != null) {
  12.                 wordName = lexeme.getLexemeText();
  13.                 pos = lexeme.getBeginPosition();
  14.                 //System.out.println("wordName: " + wordName + " pos: " + pos);
  15.                 splitLine += wordName;
  16.                 splitLine += " ";
  17.             }
  18.         } catch (Exception e) {
  19.                 e.printStackTrace();
  20.         }


阅读(5954) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~