前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >后台问题解答(2015-12-04)

后台问题解答(2015-12-04)

作者头像
我是攻城师
发布2018-05-14 14:07:41
5010
发布2018-05-14 14:07:41
举报
文章被收录于专栏:我是攻城师我是攻城师

问题:

solr采用标准分词器搜索中文时怎么控制搜索的文本内容是正序,如我要搜索“小李”,只想搜出小李飞刀这样的内容,像李小龙这样的内容不做检出

回复:

标准分词器,对中文汉字会基于单字切分,所以:

小李飞刀 会切分成 小 | 李 | 飞 | 刀 李小龙 会切分成 李 | 小 | 龙

基于lucene扩展的搜索引擎solr和elasticsearch,在索引时都会基本都会加上切分词的位置,偏移量等,所以如果你想控制正序搜索内容,其实就可以用距离查询来解决这个问题, 对搜索词加上双引号(距离查询为0语法,也就是限制两个词必须从左到右挨在一起)即可

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我是攻城师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档