`
nepshi
  • 浏览: 49542 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene索引文件

 
阅读更多
如何产生一个segment?
当IndexWriter执行commit时,会产生一个segment。

下述文件每个segment一个:
.fnm:存储一个segment中Field个数,Field名称,Field的属性(是否索引、存储etc)

.fdt:存储一个segment中,每个document中所有Field的域号、Field属性(是否分词、是否二进制、是否压缩etc),Field中存储的值

.fdx:存储一个segment中,每个document在.fdt中的偏移

.tvx, .tvd, .tvf存储了从Index->Document->Filed->Term的正向信息。
.tvf:存储一个segment中的所有Field,对每个Field,保存了Field中的所有Term信息,包含Term的文本、频率、位置、偏移量信息
.tvd:存储了一个segment中的每个Document的所有域在.tvf中的偏移量
.tvx:存储了一个segment中Document在.tvd中的偏移量以及第一个Field在.tvf中的偏移量
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics