,那么就意味着索引和搜索数据的最小单位是文档,ElasticSearch中,文档有几个重要属性:
自我包含,一篇文档同时包含字段和对应的值,也就是同时包含Key:value
可以是层次型的,一个文档中包含子文档...,倒排索引的结构使得ElasticSearch在不扫描全部文档的情况下,就可以告诉你那些文档包含特定的关键字,不过额,倒排索引是啥?...倒排索引:
ElasticSearch使用的是一种称为倒排索引的结构,采用Lucene倒排索引作为底层,这种结构适用于快速的全文检索,一个索引由文档中所有不重复的列表构成,对于每一个词,都包含他的文档列表...,
列如现在有两个文档,每个文档包含如下内容
image.png
为了创建倒排索引,我们首先要将每个文档拆分成独立的词(或称为词条或者tokens),然后创建一个不包含所有补充度的词条的排序列表,然后列出每个词出现在那个文档...,如果没有别的条件,现在这个刘昂个包含关键字的文档都将返回
在来看一个示例,比如我们通过博客标题来搜索博客文章,那么倒排索引列表就是这样的一个是结构
image.png
如果要搜索含有python标签的文章