共计 2299 个字符,预计需要花费 6 分钟才能阅读完成。
/*
*
* 这段代码用来测试文件 segment.fnm 等文件所包含的内容
*
* */
生成的索引文件.fnm 中所包含了 Document 的所有 Field 名称。
如图就是生成索引:
第一个截图是:
.fnm 文件
.fnm 包含了 Document 中的所有 field 名称
.fdx 文件
.fd 是一个是一个索引,用于存储 Document 在.fdt 中的位置
.fdt
.fdt 文件用于存储具有 Store.YES 属性的 Field 数据
.tii
.tis 文件用于存储分词后的词条(Term), 而.tii 就是它的索引文件。
它标明了每个.tis 文件中国的词条的位置
.tis
.tis 文件用于存储分词后的词条(Term)
package segment;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
public class Segment {
private String INDEX_PATH = “E:\\Lucene 项目 \\ 索引文件 ”;
Document doc1 = null;
Document doc2 = null;
public Segment(){
try
{doc1 = new Document();
Field f1 = new Field(“name1”, “smi steve ted teddy terry”, Field.Store.YES, Field.Index.TOKENIZED);
Field f2 = new Field(“name2”, “what are you doing”, Field.Store.YES, Field.Index.TOKENIZED);
Field f3 = new Field(“name3”, “how do you do”, Field.Store.YES, Field.Index.TOKENIZED);
doc1.add(f1);
doc1.add(f2);
doc1.add(f3);
doc2 = new Document();
Field f4 = new Field(“name4”, “smi steve ted teddy terry”, Field.Store.YES, Field.Index.TOKENIZED);
Field f5 = new Field(“name4”, “what are you doing”, Field.Store.YES, Field.Index.TOKENIZED);
doc2.add(f4);
doc2.add(f5);
IndexWriter writer = new IndexWriter(INDEX_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.close();
}catch(IOException e){
e.printStackTrace();
}
}
public static void main(String[] args) {
// TODO Auto-generated method stub
Segment se = new Segment();
}
}
————————————– 分割线 ————————————–
基于 Lucene 多索引进行索引和搜索 http://www.linuxidc.com/Linux/2012-05/59757.htm
Lucene 实战 (第 2 版) 中文版 配套源代码 http://www.linuxidc.com/Linux/2013-10/91055.htm
Lucene 实战 (第 2 版) PDF 高清中文版 http://www.linuxidc.com/Linux/2013-10/91052.htm
使用 Lucene-Spatial 实现集成地理位置的全文检索 http://www.linuxidc.com/Linux/2012-02/53117.htm
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a9 http://www.linuxidc.com/Linux/2012-02/53113.htm
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a8 http://www.linuxidc.com/Linux/2012-02/53111.htm
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a7 http://www.linuxidc.com/Linux/2012-02/53110.htm
Project 2-1: 配置 Lucene, 建立 WEB 查询系统 [Ubuntu 10.10] http://www.linuxidc.com/Linux/2010-11/30103.htm
————————————– 分割线 ————————————–
Lucene 的详细介绍 :请点这里
Lucene 的下载地址 :请点这里
本文永久更新链接地址 :http://www.linuxidc.com/Linux/2015-03/115262.htm