学习
实践
活动
专区
工具
TVP
写文章

【微服务】160:Elasticsearch高级使用

今天是刘小爱自学Java的第160天。

感谢你的观看,谢谢你。

学习计划安排,关于搜索功能:

搜索结果过滤的补充说明。

布尔组合查询、范围查询…等多种高级查询。

以及非常重要的聚合查询,其两种常用类型:桶和度量的说明与使用。

昨天学了match匹配和term匹配,这是两种最基础也很重要的查询方式,使用起来也简单。

一、结果过滤

补充一个知识点,关于结果过滤。

先将例子中索引库的数据做一个简单的说明,昨天的学习中也有详细介绍。

索引库liuxiaoai01中有title和price两个字段,添加了“小爱手机”、“大爱手机”、“超爱手机”和“小爱电视”一共4条数据。

如果不将结果过滤,在结果中会将title和price对应的数据都显示出来。

而通过"_source"就能指定字段,上图中指定了title字段,所以价格数据就被过滤掉了。

除了上述用法,还有两种用法

includes的使用

includes翻译过来就是包含的意思。

根据其语义理解其作用,也就是说如果索引库中有多个字段,可以通过includes来指定想要显示的字段。

excludes的使用

excludes翻译过来就是排除的意思。

也就是可以通过excludes指定不想要显示的字段,很好理解

二、高阶查询

1布尔组合查询

关键字是bool,它本身并不是一种查询方式,而是将查询方式通过逻辑运算组合起来了。

must

翻译过来就是必须的意思,可以填写多个查询条件(中括号本身表示的也就是数组)

多个查询条件通过must连接,相当于以前常用的and,说白了也就是逻辑运算符“与”。

must_not

刚好就和上述must相反,说白了也就是逻辑运算符“与”。

should

通用的道理:多个查询条件通过should连接,相当于以前常用的or,说白了也就是逻辑运算符“与”。

ps:关于其格式使用,不要看它图中好像挺复杂的样子,其实都可以通过工具有提示,并且这些写多了基本也就知道了。

2范围查询

商品都有自己的价格,用户可以通过设定价格区间搜索到对应的商品。

range就可以实现范围查询,其中通过四种字符说明查询的区间。

gt:表示大于

get:表示大于等于

lt:表示小于

lte:表示小于等于

3模糊查询

实际应用中用户搜索时输入的词条与实际词条存在偏差,但也能搜索到对应的数据,这就需要使用到模糊查询了。

关键字是fuzzy,翻译过来也就是模糊的。

上述例子中,我添加了一个apple数据,查询的时候通过appla就可以模糊查询到,但是偏差的编辑距离不能超过2,其中也可以通过fuzziness来指定允许的编辑距离。

此外还有过滤,排序这些操作,并且上述这些操作一般都是组合起来使用的,其实无外乎就是记住关键字:

关于过滤对应的也就是filter。

关于排序也就对应着sort。

三、聚合aggregations

Elasticsearch中的聚合包含多种类型,最常用的有两种:

桶(bucket)

其实蛮好理解的,比如上海现在一直在执行的垃圾分类,就有多个桶:干垃圾桶、湿垃圾桶、有害垃圾桶以及可回收物桶。

所以桶的作用就在于按照某种方式对数据进行分组,它只负责分组,不进行运算。

度量(metrics)

也就是我们以前学的聚合函数,比如求平均值、最大值、最小值以及求和…等这些运算。

2聚合的使用

在使用之前,我们需要创建一个索引库并添加数据,作为聚合的测试数据。

cars索引库,有color和make两个字段,字段类型都为keyword,也就是不分词。

也就是关于汽车的一个索引库,有颜色和生产商这两个字段。

根据我们这两天的学习情况就可以简单地实现,具体添加了哪些数据就不做说明了。

桶的使用

size表示是查询条数,我这里设置为1,主要在于一个了解,重点在于聚合结果。

aggs也就是聚合aggregations的简写,说明这是一个聚合查询:

popular_make:聚合名,这是自定义的一个名称,尽量见名知义即可。

terms:划分桶的方式,有多种方式,这里是根据词条划分。

field:划分桶的字段,这里根据make划分。

这样聚合之后,索引库中的数据就根据field这个字段划分成了4个桶:例子中也就是"honda"、"ford"、"toyota"、"bmw"。

elasticsearch中关于桶的划分方式有多种:

Date Histogram:根据日期分组。

Historgram:根据数值分组。

Terms:根据词条内容分组,也就是上述使用的。

Range:数值和日期的范围分组。

……等等多种方式。

度量的使用

认真观察和会发现它们的格式就是一样的,格式无外乎就是4步骤:

aggs说明是聚合查询。

给这个聚合自定义一个名称。

说明聚合类型:中terms是桶的类型,中avg是度量的类型。

field说明聚合字段:中根据make划分成多个桶,中求桶中price字段的平均值。

上述例子也能看出聚合之间能嵌套使用。

elasticsearch中度量的划分方式也有多种:

Avg求平均值;Max求最大值;Min求最小值;Sum求和……等等多种度量聚合方式

当然关于聚合的使用,spring集成了一个子模块Spring Data Elasticsearch,在Java中使用起来更简单,具体后续说明。

最后

行有不得反求诸己,我是@刘小爱

一个白天上班晚上学习的95后沪漂,不为其它,只为学会自律做好自己,也愿我的每日打卡能给你带来勇气,欢迎点赞关注和评论。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200919A0IO9800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券