专栏首页中间件兴趣圈Elasticsearch Query DSL概述与查询、过滤上下文

Elasticsearch Query DSL概述与查询、过滤上下文

从本节开始,先详细介绍Elasticsearch Query DSL语法,该部分是SearchAPI的核心基础之一。

Elasticsearch提供了一个基于JSON的完整查询DSL(领域特定语言)来定义查询。把查询DSL看作是查询的AST(抽象语法树),由两种类型的子句组成:

  • Leaf query clauses(叶查询字句)

叶子查询子句指在特定的字段中寻找特定的值,例如匹配、范围查询或term(完全匹配)。这些查询可以单独使用。

  • Compound query clauses(复合查询字句)

复合查询字句包装其他叶子或复合字句,用于以逻辑方式组合多个查询(如bool、dis_max)或改变他们的行为(如常量查询)。

查询子句的行为取决于它是在查询上下文中使用还是在过滤上下文中使用:

  • 查询上下文

在查询上下文中使用的查询子句,查询字句回答了“这个文档与这个查询子句(查询条件)匹配得有多好?”除了决定文档是否匹配之外,查询子句还计算一个分数,表示相对与其他文档该文档匹配的程度。每当一个查询子句传递给查询参数(query)时,查询上下文就会生效,比如搜索API中的查询参数。

  • 过滤上下文

在过滤上下文中,查询子句回答“这个文档是否匹配这个查询子句?”答案是简单的“是”或“否”——没有计算出分数。过滤上下文主要用于过滤结构化数据(相当与关系型数据库的过滤条件)。例如这个时间戳是否会在2015年到2016年之间?文章的状态是为“发布”吗?等等。

经常使用的过滤器(filter context)会被Elasticsearch自动缓存,以提高性能。每当一个查询子句被传递给过滤器参数(filter)时,过滤器上下文就会生效,例如bool查询中的filter或must_not参数、或filter查询中的常量查询(constant_score)或filter查询。

举例如下:

GET /_search
{
 "query": {         // @1
       "bool": {     // @2
             "must": [  
                       { "match": { "title":   "Search"        }},                              // @3
                    { "match": { "content": "Elasticsearch" }}                        // @4
             ],
             "filter": [     // @5
                   { "term":  { "status": "published" }},                                  // @6                  
                               { "range": { "publish_date": { "gte": "2015-01-01" }}}       // @7
                ]
         } // end bool
   }  // end query
}

代码@1:query参数定义查询上下文,query参数为elasticsearch的查询上下文。

代码@2:使用elasticsearch的bool查询表达式,会在后续详细介绍。

代码@3:查询上下文,使用关键字match,表示title字段中包含"Search"字符即认为匹配。(可以类比关系型数据库 a.title like '%Search%')

代码@4:查询上下文,使用关键字match,表示content字段中包含"Elasticsearch"字符即认为匹配。

代码@5:定义过滤上下文。

代码@6:使用term(完整匹配),即status字段的值是否是“published”。(相当于关系型数据库的 a.status = 'published')

代码@7:使用range,代表范围匹配,即publish_date字段的值是否大于等于2015-01-01。(相当于a.publish_date >= 2015-01-01')。

本文就介绍到这里了,整个系列将进入到ES DSL查询语法的学习中来。接下来将从如下方面详细介绍ES DSL查询语法:

  • 全文检索(Full text queries)
  • 词条查询(Term level queries)
  • 复合查询
  • Nested(关联查询)

本文分享自微信公众号 - 中间件兴趣圈(dingwpmz_zjj),作者:丁威

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-11-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Elasticsearch Search API 概述与URI Search

    注意:search_type,request_cache和allow_partial_search_results这三个参数,必须查询url级别的参数(quer...

    丁威
  • Elasticsearch Query DSL之Compound queries(复合查询)

    本文将重点介绍Elasticsearch Query DSL之Compound queries(复合查询)。

    丁威
  • Elasticsearch Query DSL之全文检索(Full text queries)上篇

    全文索引查询,这意外着首先会对待查字符串(查询条件)进行分词,然后再去匹配,返回结果中会待上本次匹配的关联度分数。

    丁威
  • 将SQL优化做到极致 - 子查询优化

    编辑手记:子查询是SQL中比较重要的一种语法,恰当地应用会很大程度上提高SQL的性能,若用的不得当,也可能会带来很多问题。因此子查询也是SQL比较难优化的部分。...

    数据和云
  • Access生成表查询

    大家好前面已经介绍了选择查询、参数查询、交叉表查询,本节开始介绍操作查询部分内容。

    无言之月
  • Access查询设计界面

    大家好,上节介绍了Access查询的知识框架,其实Access数据库的查询的功能很类似于Excel表中的筛选功能,但是功能更为丰富和强大。

    无言之月
  • Access查询基础

    大家好,前面介绍了Access数据库表部分的内容,后面开始介绍Access数据库查询部分的内容。

    无言之月
  • 快速学习Oracle-子查询

    子查询:在一个查询的内部还包括另一个查询,则此查询称为子查询。 Sql的任何位置都可以加入子查询。

    cwl_java
  • 我的Mysql查询SQL优化总结

    当我们遇到一个慢查询语句时,首先要做的是检查所编写的 SQL 语句是否合理,优化 SQL 语句从而提升查询效率。所以对 SQL 有一个整体的认识是有必要的。

    程序员小明
  • kibana使用

    能不用空格表示OR或者AND就不用空格表示,因为要么全用要么全部不用,否则会因为解析搜索同级的时候,若出现空格和OR,会冲突覆盖意义,虽不会报错,但是,得不到自...

    ydymz

扫码关注云+社区

领取腾讯云代金券