前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >elasticsearch5.x以后版本引入中文分词器

elasticsearch5.x以后版本引入中文分词器

作者头像
johnhuster的分享
发布2022-03-29 14:42:17
2660
发布2022-03-29 14:42:17
举报
文章被收录于专栏:johnhuster

由于elasticsearch自带的分析器(analyzer)对中文分析效果无法达到中国地区的需求,幸运的是我们可以使用elasticsearch-analysis-ik来​​​​​​插件来完善elasticsearch对中文的处理能力。

看下分词效果,待分析文本为:中华人民共和国解放军hello

使用elasticsearch自带的standard分析器:

ik分析器分词效果:

好了下面直接给出实现方案:

1、下载ik插件,放在elasticsearch安装目录plugins/ik目录下,可参考https://github.com/medcl/elasticsearch-analysis-ik

2、把plugins/ik对应到docker内elasticsearch路径/usr/share/elasticsearch/plugins

3、重新启动elasticsearch,创建索引:通过http://localhost:9200/索引名字

4、通过http://172.21.48.16:9200/索引名字/_mapping/type名字 创建映射

代码语言:javascript
复制
{
    "student": {
      "properties": {
        "address": {
          "properties": {
            "city": {
              "type": "text",
               "analyzer": "ik_smart",
               "search_analyzer": "ik_smart",
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "prov": {
              "type": "text",
               "analyzer": "ik_smart",
               "search_analyzer": "ik_smart",              
              "fields": {
                "keyword": {
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            }
          }
        },
        "age": {
          "type": "long"
        },
        "name": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        }
      }
    }
}

PS:低版本elasticsearch把上面的配置放在elasticsearch.yml文件中,但5.x以后需要通过上面的方式设置

5、验证分词效果:

参考:https://github.com/medcl/elasticsearch-analysis-ik

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/11/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档