专注点,细心点,耐心点 知行合一
发布时间:2013-01-23 22:06:35
在上一篇《利用Xapian构建自己的搜索引擎:Database》里指出database是Xapian的基础,而这一篇里讲到的documents、terms和values则是索引和查询的必要组成部分。Documents 、terms and posting在信息检索(IR)中,我们企图要获取的项称之为“document”,每一个document是被一个terms集合所描述.........【阅读全文】
发布时间:2013-01-23 22:05:35
在Xapian1.0之前,是使用quartz作为database文件格式的,不过自从1.0之后,便改用Flint作为database的文件格式了。有时候,我们会将database称为“索引”,在Xapian中,索引通常比被索引的documents还要多,这表示Xapian做一个信息检索系统比做一个信息存储系统更适合。 Database的存储.........【阅读全文】
发布时间:2013-01-12 19:32:35
FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args> 的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path 。对 HDFS文件系统,scheme是hdfs ,对本地文件系统,scheme是file 。其中scheme和 authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。一个HDFS文件或目录比如/parent/child可 以表示成hdfs://namenode:namenodepo......【阅读全文】