范德萨发而为
全部博文(392)
发布时间:2013-06-18 12:44:16
Lucene's default similarity functionLucene's scoring Function is defined by the function where tf(t in d) denotes the term's frequency, defined as the number of times the term t appears in the currently scored document d. Documents that have more occ.........【阅读全文】
发布时间:2013-06-17 22:48:30
1. 同步概念Xapian没有显示的支持多线程,为了避免不必要的线程死锁,Xapian没有使用任何全局变量,所以你可以你的多线程应用中放心的使用Xapain对象,但是一些Xapian对象内部是有关联的,如Xapian::Database::get_document(),返回的对象Xapian::Document对象内部保存了一个指向DataBase的一个引用,所以它不适合在多.........【阅读全文】
发布时间:2013-06-15 11:01:19
used index statistics per index segment, and make them available at search time. To understand the new statistics, let's pretend we've indexed the following two example documents, each with only one field "title":document 1: The Lion, the Witch, and the Wardrobedocument 2: The Da.........【阅读全文】
发布时间:2013-06-14 23:03:24
今天发现使用git add之后,用git diff无法看到新增文件的内容,查看下文之后发现使用git diff --cached才能看到。GOOD转自:http://roclinux.cn/?p=343温故而知新,恩!本次复习之前的内容。1获得帮助可以使用类似man git-****的命令格式:想获得关于commit命令的帮助,则man git-commit想获得关.........【阅读全文】
发布时间:2013-06-14 11:50:40
探寻C++最快的读取文件的方案在竞赛中,遇到大数据时,往往读文件成了程序运行速度的瓶颈,需要更快的读取方式。相信几乎所有的C++学习者都在cin机器缓慢的速度上栽过跟头,于是从此以后发誓不用cin读数据。还有人说Pascal的read语句的速度是C/C++中scanf比不上的,C++选手只能干着急。难道C++真的低Pascal一等吗?.........【阅读全文】
CU博客助理2013-01-08 14:27
chinaunix网友2010-04-18 14:30
你好,可以麻烦你加我的qq么:852476785 看了你hadoop那篇编程,Sogo日志分析那个,想请教一下。。。。非常非常非常非常非常非常感性吖