倒排索引的核心组成
单词词典(Term Dictionary)
记录所有文档的单词,记录单词到倒排列表的关联关系, 单词词典一般比较大,可以通过B+树或哈希拉链法实现,以满足性能的插入与查询....Analysis - 文本分析是把全文本转换一系列单词(term / token)的过程,也叫分词
# Analysis是通过Analyzer来实现的
# 可使用Elasticsearch内置的分析器.../或者按需定制化分析器
# 除了在数据写入时转换词典,匹配Query语句时也需要用相同的分析器对查询语句进行分析
Analyzer的组成
分词器是专门处理分词的组件, Analyzer由三部分组成:...分片的路由信息
# 任意节点都能修改信息会导致数据的不一致性....1,解决了over-sharding的问题
# 影响搜索结果的相关性打分,影响统计结果的准确性.
# 单个节点上过多的分片,会导致资源浪费,同时也会影响性能.