lucene入门-itanger-ChinaUnix博客

爪哇夜未眠:杰哥走向架构之路

首页　| 　博文目录　| 　关于我

itanger

博客访问： 919708
博文数量： 215
博客积分： 10062
博客等级：上将
技术积分： 2235
用户组：普通用户
注册时间： 2007-12-01 13:21

文章分类

全部博文（215）

HTML5（0）
美文（1）
PHP（1）
XML（1）
Mysql（2）
Grails（4）
Ruby（1）
从现在开始（3）
SVN（1）
网页设计（3）

DreamWeaver（2）

Div+Css（1）
ajax（6）
通用（4）
JavaScript（30）
生活感悟（6）
计算机（7）

系统（4）

BIOS（1）
PhotoShop（1）
Oracle（1）
SQlServer（11）
Asp.net（14）
JAVA（110）

websphere（2）

工具类（1）

android（16）

Lucene（1）

Log4j（1）

Jboss（1）

Java架构（3）

J2ee（2）

SSH（2）

WebService（2）

WML-无线标记语言（2）

WebLogic（3）

iBatis（1）

EJB（3）

Spring（3）

JAVA基础（17）

Eclipse（3）

OSCache（1）

Tomcat（6）

服务器（0）

数据库（3）

Servlet（1）

算法（3）

JBuilder（1）

Hibenate（9）

JSF（7）

Struts（14）
未分配的博文（8）

文章存档

2012年（1）

2011年（24）

2009年（16）

2008年（91）

2007年（83）

我的朋友

相关博文

lucene入门

分类： Java

2008-07-01 17:53:36

先到下载找到lucene-core-2.3.2.jar,lucene-demos-2.3.2.jar加到Class_path中

就可以使用

下面是具体的使用:

---建立索引目录

package cn.jane.main;

import java.io.File;
import java.io.FileReader;
import java.io.Reader;
import java.util.Date;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;

public class TxtFileIndexer {
public static void main(String[] args) throws Exception{
  //indexDir is the directory that hosts Lucene's index files
        File   indexDir = new File("D:\\luceneIndex"); //***********
        //dataDir is the directory that hosts the text files that to be indexed
        File   dataDir = new File("D:\\luceneData"); //**************
        Analyzer luceneAnalyzer = new StandardAnalyzer();
        File[] dataFiles = dataDir.listFiles();
        IndexWriter indexWriter = new IndexWriter(indexDir,luceneAnalyzer,true);
        long startTime = new Date().getTime();
        for(int i = 0; i < dataFiles.length; i++){
        if(dataFiles[i].isFile() && dataFiles[i].getName().endsWith(".txt")){
          System.out.println("Indexing file " + dataFiles[i].getCanonicalPath());
          Document document = new Document();
          Reader txtReader = new FileReader(dataFiles[i]);
//        document.add(Field.Text("path",dataFiles[i].getCanonicalPath())); 版本为1.9的时候用的方法
//           document.add(Field.Text("contents",txtReader));
                document.add(new Field("path",dataFiles[i].getCanonicalPath(),Field.Store.YES,Field.Index.TOKENIZED));
                document.add(new Field("contents",txtReader));

          indexWriter.addDocument(document);
        }
        }
        indexWriter.optimize();
        indexWriter.close();
        long endTime = new Date().getTime();

        System.out.println("It takes " + (endTime - startTime)
                           + " milliseconds to create index for the files in directory "
                     + dataDir.getPath());
}
}

---查找的方法

package cn.jane.main;

import java.io.File;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.FSDirectory;

public class TxtFileSearcher {
public static void main(String[] args) throws Exception{
     String queryStr = "lucene";
     //This is the directory that hosts the Lucene index
        File indexDir = new File("D:\\luceneIndex");
        FSDirectory directory = FSDirectory.getDirectory(indexDir,false);
        IndexSearcher searcher = new IndexSearcher(directory);
        if(!indexDir.exists()){
        System.out.println("The Lucene index is not exist");
        return;
        }
        Term term = new Term("contents",queryStr.toLowerCase());
        TermQuery luceneQuery = new TermQuery(term);
        Hits hits = searcher.search(luceneQuery);
        for(int i = 0; i < hits.length(); i++){
        Document document = hits.doc(i);
        System.out.println("File: " + document.get("path"));
        }
        System.out.println("success!");
}
}

-----------------基本已经完成

阅读(924) | 评论(0) | 转发(0) |

上一篇：使用SAX来解析XML

下一篇：PHP入门

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6