Chinaunix首页 | 论坛 | 博客
  • 博客访问: 914655
  • 博文数量: 453
  • 博客积分: 7865
  • 博客等级: 少将
  • 技术积分: 5673
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-29 16:21
个人简介

时光荏苒..

文章分类
文章存档

2015年(46)

2014年(22)

2013年(68)

2012年(218)

2011年(99)

分类: 大数据

2015-01-23 11:37:35

相关文章:
java开源类库pinyin4j的使用
API:
介绍:

使用的是 pinyin4j-2.5.0:
  1. package analyzer;

  2. import net.sourceforge.pinyin4j.PinyinHelper;
  3. import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
  4. import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
  5. import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
  6. import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
  7. import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

  8. public class PinYin4jAnalyzerTest {

  9.     /**
  10.      * @param args
  11.      * @throws BadHanyuPinyinOutputFormatCombination
  12.      */
  13.     public static void main(String[] args) throws BadHanyuPinyinOutputFormatCombination {
  14.         // TODO Auto-generated method stub
  15.         
  16.         HanyuPinyinOutputFormat hypyOutPutFormat = new HanyuPinyinOutputFormat();
  17.         hypyOutPutFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
  18.         hypyOutPutFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  19.         hypyOutPutFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
  20.         
  21.         String[] outString = PinyinHelper.toHanyuPinyinStringArray('单', hypyOutPutFormat);
  22.         for(String s : outString){
  23.             System.out.println(s+" / ");
  24.         }
  25.         
  26.     }

  27. }
结果:
dan /
chan /
shan /
如果把‘单’改成‘我’,则结果只有一个: “wo /”

pinyin4j的确是支持多音字,但是不支持消除歧义的多音字,如“音乐”,使用pinyin4j可以都转换出来,但是至于是yinyue还是yinle,应该不支持的。目前还没有看到。

阅读(1076) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~