搜索引擎的通常索引单位是单词,单词词典是由文档集合中出现过的所有单词构成的字符串集合,单词词典内每条索引项记载单词本身的一些信息以及指向“倒排列表”的指针。...如图所示,倒排索引中主要有两部分:词典和倒排文件。词典和倒排表是Lucene中很重要的两种数据结构,是实现快速检索的重要基石。词典和倒排文件是分两部分存储的,词典在内存中而倒排文件存储在磁盘上。...如:首先查询词条A的倒排列表[1,2,3],然后查询词条B的倒排列表[2,3,4],将两个倒排列表做交集取[2,3],就是即包含词条A又包含词条B的文档结果集。...如:首先查询词条A的倒排列表[1,2,3],然后查询词条B的倒排列表[2,3,4],将两个倒排列表做并集取[1,2,3,4],就是包含词条A或包含词条B的文档结果集。...持久化:在达到触发条件以后,会将内存中缓存的数据一次性写入磁盘中,并生成提交点,此时该段数据可以被检索到。
释放内存:释放内存并等待新的数据写入。
?