前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Elasticsearch IK 分词器

Elasticsearch IK 分词器

作者头像
Kevin song
发布2020-04-30 16:08:08
4.8K0
发布2020-04-30 16:08:08
举报

IK分词器介绍

在elasticsearch 中查询数据,使用了默认的分词器,分词效果不太理想。会把字段分成一个一个汉字,搜索时会把搜索到的句子进行分词,非常不智能,所以本次引入更为智能的IK分词器。

IK分词器提供两种分词算法 ik_smart和ik_max_word,ik_smar为最少切分,ik_max_word最精细度切分。

IK 分词器下载安装

下载地址

根据es版本选择对应的IK版本,本次使用的6.8.4 IK分析器版本。

代码语言:javascript
复制
https://github.com/medcl/elasticsearch-analysis-ik/releases

将IK分词器压缩文件解压到elasticsearch安装目录的plugins目录下命名ik目录

代码语言:javascript
复制
#解压analysis-ik文件
[root@elk-node1 plugins]# pwd
/usr/share/elasticsearch/plugins
unzip elasticsearch-analysis-ik-6.8.4.zip  -d ik
#删除源压缩文件
rm -rf elasticsearch-analysis-ik-6.8.4.zip

重启 es 服务

代码语言:javascript
复制
systemctl    restart  elasticsearch

查看es安装的插件

代码语言:javascript
复制
#es 命令查看插件列表
[root@elk-node1 elasticsearch]# pwd
/usr/share/elasticsearch
[root@elk-node1 elasticsearch]# ./bin/elasticsearch-plugin list
ik
#curl查看es插件
[root@elk-node1 elasticsearch]#  curl -u elastic:qZXo7E -XGET "http://192.168.99.185:9200/_cat/plugins"
elk-node1 analysis-ik 6.8.4
elk-node2 analysis-ik 6.8.4

kibana 查看es插件列表

IK分词器测试

以”我爱你中国“为例, 默认的分词器会直接分为 "我" "爱" "你" "中" "国" 。

默认分词器

IK分词器 ik_smart算法

ik_smart算法会将"我爱你中国"分为 "我爱你" "中国"。

IK分词器ik_max_word算法

ik_max_word算法会将"我爱你中国"分为 "我爱你" "我" "爱你" "中国"。

自定义IK分词字典

以”我爱你中国“为例,自定义"爱你中国"组成一个分词。

编辑IK插件配置文件

代码语言:javascript
复制
[root@elk-node2 config]# pwd
/usr/share/elasticsearch/plugins/ik/config
#添加songhp.dic 扩展字典
[root@elk-node2 config]# cat songhp.dic 
爱你中国
#配置IK配置文件
[root@elk-node2 config]# vim IKAnalyzer.cfg.xml 
#重启es服务
 systemctl    restart  elasticsearch

Kibana测试分词

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源搬运工宋师傅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档