----
概述
继续跟中华石杉老师学习ES,第28篇
课程地址: https://www.roncoo.com/view/55
之前大家会发现,我们全部是用英文在学习,其实我们更习惯用中文做搜索。...英文默认的standard分词器没有办法对中文进行合理分词的,只是将每个中文字符一个一个的切割开来,比如说中国人 --> 中 国 人
在搜索引擎领域,比较成熟和流行的,就是ik分词器
举个简单的例子:...将 zip包解压到 ik目录下 ,我这里用的是6.4.1 ,所以我下载对应的版本的ik
?
重启es ,观察启动日志 loaded plugin [analysis-ik]
?...,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;
----
ik_smart
ik_smart...比如这个时候搜索“共和国” --> 中华人民共和国和国歌,搜到吗???? 显然不能搜索的到。 根据场景合理选择。