如何产生一个segment?
当IndexWriter执行commit时,会产生一个segment。
下述文件每个segment一个:
.fnm:存储一个segment中Field个数,Field名称,Field的属性(是否索引、存储etc)
.fdt:存储一个segment中,每个document中所有Field的域号、Field属性(是否分词、是否二进制、是否压缩etc),Field中存储的值
.fdx:存储一个segment中,每个document在.fdt中的偏移
.tvx, .tvd, .tvf存储了从Index->Document->Filed->Term的正向信息。
.tvf:存储一个segment中的所有Field,对每个Field,保存了Field中的所有Term信息,包含Term的文本、频率、位置、偏移量信息
.tvd:存储了一个segment中的每个Document的所有域在.tvf中的偏移量
.tvx:存储了一个segment中Document在.tvd中的偏移量以及第一个Field在.tvf中的偏移量
分享到:
相关推荐
lukeall,Lucene索引文件查看工具可支持Lucene4.7版本的索引查看,直接双击打开,选择索引目录进行使用
lucene索引文件格式介绍,很详细,每一个文件都解释了,一目了然,做项目用的
luke源码--查看lucene索引文件
Lucene索引文件格式,本文定义了Lucene(版本1.3)用到的索引文件的格式。
查看lucene索引文件的document和field
行业分类-设备装置-一种修改Lucene索引文件中词的方法及装置
lucene索引查看工具及源码lucene索引查看工具及源码lucene索引查看工具及源码
NULL 博文链接:https://cxl2012.iteye.com/blog/2233035
这是Lucene3.0索引查看文件 直接运行jar包就可以打开ui界面 陪好路径就可以使用了
luke lucene索引数据查看器.Luke 是查询LUCENE索引文件的工具, 而且用 Luke 的Search可以做查询。
Lucene创建索引,查询索引的简单使用。
Lucene5写的全文搜索的demo,包括创建索引和搜索
Lucene 删除 合并索引,可以指定几个索引文件合并成一个索引文件。自己写的,有很多不足之处请多指教
第三节 Lucene索引文件格式分析··· 9 一、 Lucene源码实现分析的说明··· 9 二、 Lucene索引文件格式··· 10 三、 一些公用的基础类··· 12 四、 存储抽象··· 13 五、 关于cLucene项目··· 15 ...
最后,虽然Lucene使用Java语言写成,但是开放源代码社区的程序员正在不懈的将之使用各种传统语言实现(例如.net framework[14]),在遵守Lucene索引文件格式的基础上,使得Lucene能够运行在各种各样的平台上,系统...
lucene 对 xml建立索引 建立索引就是怎么简单 呵呵
最后,虽然Lucene使用Java语言写成,但是开放源代码社区的程序员正在不懈的将之使用各种传统语言实现(例如.net framework[14]),在遵守Lucene索引文件格式的基础上,使得Lucene能够运行在各种各样的平台上,系统...
iTextPDFExtractor.java ------ ...--PDFBox创建PDF文件的Lucene索引 PDFBoxPathIndex.java ------- --PDFBox创建指定目录PDF文档索引 POIOfficeExtractor.java ----- -- POI处理Excel和Word文档代码
别人用.net写的查看lucene索引文件的工具
lucene 是全开源文索引搜索引擎,使用它可以很快的架设我们自己的搜索引擎,但遗憾的是它默认只对txt和html格式文档生成index,但我们常常要使用其他的文档如word,pdf等,我搜集了这几种文档生成index的笔记