Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2416964
  • 博文数量: 392
  • 博客积分: 7040
  • 博客等级: 少将
  • 技术积分: 4138
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-17 13:03
个人简介

范德萨发而为

文章分类

全部博文(392)

文章存档

2017年(5)

2016年(19)

2015年(34)

2014年(14)

2013年(47)

2012年(40)

2011年(51)

2010年(137)

2009年(45)

发布时间:2013-01-10 20:50:22

用 Xapian 和 Omega 读取并索引文档安装并部署开源 Xapian 来索引多种信息Martin C. Brown, 作家, Freelance简介: 存储并提供对文档和信息的访问是很多公司都面临的一个日益严重的问题。解决这个问题有很多解决方案,包括 wikis 和结构化了的文档存储,但全文本索引通常是从大量文档中获取信息的惟一方式。Xapian 是一种开源工具,可读取并索引文档,包括 HTML、PDF、 OpenOffice、Microsoft® Office® 等格式的文档,而且还具有一些可编程的接口来添加和抽取信息,包括 Java™ 技术......【阅读全文】

阅读(1602) | 评论(0) | 转发(0)

发布时间:2012-11-29 11:15:12

......【阅读全文】

阅读(5722) | 评论(0) | 转发(1)

发布时间:2012-11-28 16:20:44

开始进入IK分词的另一个核心模块,分词歧义处理,这里使用了组合遍历的一些代码,代码有点绕 总体思路是这样......【阅读全文】

阅读(5662) | 评论(2) | 转发(1)

发布时间:2012-11-28 13:14:01

这次详细介绍IK里的三个分词器:CJKSegmenter(中文分词),CN_QuantifierSegmenter(数量词分词),LetterSegmenter(字母分词)。......【阅读全文】

阅读(6307) | 评论(0) | 转发(1)

发布时间:2012-11-28 11:52:19

......【阅读全文】

阅读(8076) | 评论(0) | 转发(1)
给主人留下些什么吧!~~

CU博客助理2013-01-09 08:37

jiangwen127: 这个是自动推荐的吗,还是需要博主主动去推荐.....
工作人员更新

回复  |  举报

CU博客助理2013-01-08 17:27

jiangwen127: 晕,我以为是删选之后推荐到blog.chinaunix.net的首页.....
如果你有写的特别好的文章,最好是近期的,就可以到博客首页。

回复  |  举报

CU博客助理2013-01-08 14:27

jiangwen127: http://blog.chinaunix.net/uid-20761674-id-3424553.html
我推荐首页的文章怎么老是不行呢,给点意见吧.....
已经在你的首页了啊,怎么不行了?

回复  |  举报

chinaunix网友2010-04-18 19:44

你好,可不可以麻烦你加一下我的qq啊。。。有几个问题想问问。很着急啊。。谢谢噢:852476785

回复 |  删除 |  举报

chinaunix网友2010-04-18 14:30

你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖

回复 |  删除 |  举报
留言热议
请登录后留言。

登录 注册