Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1130325
  • 博文数量: 170
  • 博客积分: 1603
  • 博客等级: 上尉
  • 技术积分: 1897
  • 用 户 组: 普通用户
  • 注册时间: 2010-07-09 15:54
文章分类

全部博文(170)

文章存档

2016年(27)

2015年(21)

2014年(27)

2013年(21)

2012年(7)

2011年(67)

我的朋友

分类: Mysql/postgreSQL

2011-04-15 11:56:07

中文分词插件使用的开源中文分词插件
首先安装SCWS-1.0.4(最新版本scws-1.1.0 发布于 2010-1-29)
直接编译安装,指定prefix=/usr/local/scws
这个东西基本是个绿色软件,可以不用编译rpm包,不需要直接删除整个文件夹
下载相应编码的词典文件放入/usr/local/scws/etc中
utf-8的词典为dict.utf8.xdb(1.1.0最新版可以自定义词库了,所以不需要通过修改核心词库xdb来建立自己的词库了)
下载mysql的源码包——mysql-5.1.32-1.fc11.src.rpm
因为分词插件是以mysql-5.1-30制作,所以版本不要差距太大
安装scr.rpm包

下载mysql调用scws插件:
解压后把myft_scws_udf_5.1.30.patch复制到/usr/src/redhat/SOURCES中
修改/usr/src/redhat/SPECS/mysql.spec文件
在patch7下面增加
Patch8: myft_scws_udf_5.1.30.patch
在%patch7 -p1下面增加
%patch8 -p0
编译生成rpm包
rpmbuild -ba /usr/src/redhat/SPECS/mysql.spec

备份编译好的rpm包拿出来并rpm -ivh

这时候/usr/src/redhat/BUILD中还有mysql5.1.3的文件夹
将/myft-5.1.30-081231/plugin/scws文件夹
复制到/usr/src/redhat/BUILD mysql5.3/plugin中
进入plugin/scws目录
./configure --prefix=/usr/shar/mysql --with-scws=/usr/local/scws
这时候会在mysql中生成plugin目录里面包含scws的.o和.la文件,将这几个文件复制到mysql的plugin文件夹中(rpm安装后在/usr/lib/mysql/plugin/)并做好对应软连接(没尝试过--prefix=/usr/lib/mysql)
这时插件已经安装完成了

配置
在[mysqld] 字段里加入 ft_min_word_len = 2
进入mysql运行INSTALL PLUGIN scws_parser SONAME 'libftscws.so';(只需要一次)

创建分词测试函数(只需一次):
CREATE FUNCTION scws_segment RETURNS STRING SONAME 'libftscws.so';
CREATE FUNCTION scws_topwords RETURNS STRING SONAME 'libftscws.so';
中文分词是基于全文索引的,全文索引只支持MyISAM格式的表

这篇一年半前写的,中文分词插件更新了....貌似还是比较和mysql5.1合拍
redhat el 6才开始用mysql 5.1,所以中文分词插件最好用redhat6,5系列上5.1许多依赖都要去解决麻烦得要死,5.0是libmysqlclient.so.15.0.0,5.1是ibmysqlclient.so.16.0.0
阅读(3007) | 评论(0) | 转发(0) |
0

上一篇:windows蓝屏dmp分析

下一篇:tcpdump工具抓包

给主人留下些什么吧!~~