Chinaunix首页 | 论坛 | 博客
  • 博客访问: 650175
  • 博文数量: 46
  • 博客积分: 10071
  • 博客等级: 上将
  • 技术积分: 531
  • 用 户 组: 普通用户
  • 注册时间: 2007-07-29 08:42
文章分类

全部博文(46)

分类: Windows平台

2014-12-04 12:38:07

转帖请注明出处

文章:《php 分词技术》

来源:http://blog.ddian.cn/index.php


最近发现新浪SAE平台上竟然也提供分词功能,分词效果也还不错,由新浪爱问提供的分词服务,研究了一番,做了一个简易版的在线调用接口(get方式,非post)

官网说明:,SAE分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。

调用规则:{语句}

(返回结果里包含分词词性,随便用个程序语言处理一下就行了,详见:)

只需要改变URL中的{语句}参数即可(编码为utf-8),因为是get方式传参,语句不能太长;也可以根据官方的,做个简易的post方式。

另推荐几个分词系统:

1、Python的结巴中文分词系统(推荐),demo: ,下载地址:

2、中科院ICTCLAS中文分词系统,支持C/C#/C++/JAVA,32/64都有其对应的版本,有开发能力的可以尝试一下。

3、海量云分词系统 ,分词效果也不错,可以申请到api接口,官网:



阅读(1605) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~