什么是相关性 首先需要了解什么是相关性?默认情况下,搜索返回的结果是按照 相关性 进行排序的,也就是最相关的文档排在最前。...相关性是由一个所谓的打分机制决定的,每个文档在搜索过程中都会被计算一个_score字段,这是一个浮点数类型,值越高表示分数越高,也就是相关性越大。...提高搜索的相关性 我们通过一个示例来展开这部分的讨论。.../_doc/3 { "content": "Known for its simple REST APIs, distributed nature, speed, and scalability, Elasticsearch...默认情况下,上面的查询ES会使用OR来分别查询每个term,也就是说上面的查询会被解析为 simple OR rest OR apis OR distributed OR nature 然后查询的结果相加的分数就是整个查询的分数
最近我们在做场馆搜索的功能时,接触到elasticsearch(简称es)搜索引擎。...查询正则因子(Query Normalization Factor) 查询正则因子(queryNorm)试图将查询正则化,这样就能比较两个不同查询结果。...ElasticSearch预定义了一些函数: weight 为每个文档应用一个简单的而不被正则化的权重提升值:当 weight 为 2 时,最终结果为 2 * _score field_value_factor...一般只用于数字类型,而衰减函数一般只用于数字、位置和时间类型 这时候就需要script_score了,它支持我们自己编写一个脚本运行,在该脚本中我们可以拿到当前文档的所有字段信息,并且只需要将计算的分数作为返回值传回Elasticsearch...此时可以编写Groovy脚本(Elasticsearch的默认脚本语言)来提高游泳相关场馆的分数。 return doc['category'].value == '游泳' ?
其他内容,参考Elasticsearch官方指南整理 ES中的连接 在ES中支持两种连接方式:嵌套查询 和 has_child、has_parent父子查询 嵌套查询: 文档中包含嵌套的字段,这些字段以数组的形式保存对象.../reference/current/mapping-parent-field.html 2 连接查询:https://www.elastic.co/guide/en/elasticsearch/reference.../current/joining-queries.html 3 Nested查询:https://www.elastic.co/guide/en/elasticsearch/reference/current.../query-dsl-nested-query.html 4 Has_Child查询:https://www.elastic.co/guide/en/elasticsearch/reference/current.../query-dsl-has-child-query.html 5 Has_Parent查询:https://www.elastic.co/guide/en/elasticsearch/reference
1.DSL查询文档 elasticsearch的查询依然是基于JSON风格的DSL来实现的。...1.1.DSL查询分类 Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。...常见的有两种: fuction score:算分函数查询,可以控制文档相关性算分,控制文档排名 bool query:布尔查询,利用逻辑关系组合多个其它的查询,实现复杂搜索 1.5.1.相关性算分 当我们利用...如图: 要想认为控制相关性算分,就需要利用elasticsearch中的function score 查询了。...但是elasticsearch将来一定是集群,例如我集群有5个节点,我要查询TOP1000的数据,并不是每个节点查询200条就可以了。
背景 Elasticsearch(ES)可用于全文检索、日志分析、指标分析、APM等众多场景,而且搭建部署容易,后期弹性扩容、故障处理简单。...从使用的直观感受看,ES按照下图方式实现了分布式查询: [图1 查询基本流程] 查询可发送到任意节点,接收到某查询的节点会作为该查询的协调节点(Coordinating Node)。...关于这类问题的具体描述,可以参考如下文档: 被破坏的相关度 How Shards Affect Relevance Scoring in Elasticsearch 3....查询调度:根据查询请求条件,进行查询的Query Phase、Fetch Phase等执行流程,返回查询结果。 ...介绍完查询入口后,下面我们具体介绍查询执行过程中的调度部分。
前言 本文使用的Elasticsearch版本为6.5.4,上文主要介绍ES的各种查询,以满足更多的需求。ES的主要功能其实就是体现在这搜索查询上,所以我就总结一下,方便以后直接拿来就用。...terms查询 term query回去倒排索引中寻找确切的term(即精准查询),它并不知道分词器的存在。...match query知道「分词器的存在」,会对filed进行分词操作,然后在查询 match_all:查询所有文档 multi_match:可以指定多个字段 match_phrase:短语匹配查询,...Elasticsearch引擎首先分析(analyze)查询字符串,从分析后的文本中构建短语查询,这意味着必须匹配短语中的所有分词,并且保证各个分词的相对位置不变; # 分词的体现# 匹配的条件越多,相似度的值将会越高...i" } } } fuzzy实现模糊查询 value:查询的关键字 boost:查询的权值,默认值是1.0 min_similarity:设置匹配的最小相似度,默认值为0.5,对于字符串
Elasticsearch在2.x版本的时候把filter查询给摘掉了,因此在query dsl里面已经找不到filter query了。...比如,query的时候,会先比较查询条件,然后计算分值,最后返回文档结果; 而filter则是先判断是否满足查询条件,如果不满足,会缓存查询过程(记录该文档不满足结果);满足的话,就直接缓存结果。...如果一个查询既有filter又有should,那么至少包含一个should子句。 bool查询也支持禁用协同计分选项disable_coord。一般计算分值的因素取决于所有的查询条件。..."term" : { "tag" : "wow" } }, { "term" : { "tag" : "elasticsearch...2 《Elasticsearch IN Action》
简介 官网地址:https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-function-score-query.html...这时就需要用到function_score 查询(function_score query) ,在 Elasticsearch 中function_score是用于处理文档分值的 DSL,它会在查询结束后对每一个匹配的文档进行一系列的重打分操作...GET /_search { "query": { "function_score": { "query": { "match": { "message": "elasticsearch...之前的两种方式都无法给字符串打分,但是如果我们自己写脚本的话却很简单,使用 Groovy(Elasticsearch 的默认脚本语言)也就是一行的事: return doc ['category'].value...1.1 : 1.0" } } } } 或是将脚本放在elasticsearch/config/scripts下,然后在查询语句中引用它: category-score.groovy
Elasticsearch的查询语言(DSL)真是不好写,偏偏查询的功能千奇百怪,filter/query/match/agg/geo各种各样,不管你是通过封装JSON还是通过python/java的api...最近发现了一个插件,Elasticsearch-SQL可以用sql查询Elasticsearch,感觉这个轮子造的真是好。...Elasticsearch-sql的项目地址:https://github.com/NLPchina/elasticsearch-sql 1、简介 Elasticsearch-sql实现的功能: 1)插件式的安装...2)SQL查询 3)超越SQL之外的查询 4)对JDBC方式的支持 2、插件式的安装 安装方法和elasticsearch-head的安装方法类似: 我们使用的es版本是2.1.1,如果你用的是不同的版本...安装成功以后我们就可以通过sql查询ES了。
Elasticsearch作为底层数据框架提供大数据量(亿级)的实时统计查询的方案设计工作,花了些时间学习Elasticsearch的基础理论知识,整理了一下,希望能对Elasticsearch感兴趣/...现在再看起来,似乎和传统数据库通过B-Tree的方式类似啊,为什么说比B-Tree的查询快呢?...Term Index B-Tree通过减少磁盘寻道次数来提高查询性能,Elasticsearch也是采用同样的思路,直接通过内存查找term,不读磁盘,但是如果term太多,term dictionary...联合索引 上面说了半天都是单field索引,如果多个field索引的联合查询,倒排索引如何满足快速查询的要求呢?...list里的ID到磁盘中查找Document信息的那步,因为Elasticsearch是分Segment存储的,根据ID这个大范围的Term定位到Segment的效率直接影响了最后查询的性能,如果ID
查看es的集群状态 http://IP:9200/_cat/health?v 注: IP指es集群某个ip地址, ?v表示格式化输出 查看es集群节点列表 ht...
本小节主要讲述关于Elasticsearch的几种常见查询,希望自己在使用时候再回来看此文更能快速理解其中含义....本文所有实践基于Elasticsearch 2.3.3 我们先从查询小苍苍这个用户开始今天的话题: ? 1....(query)语句来进行 全文 搜索或者其它任何需要影响 相关性得分 的搜索。...: 当我们有时候需要 分词查询 和 term 精确查询一起使用时,我们是希望term不需要缓存数据,而match根据匹配度进行排序 { "query":{ "bool":{...到这里结束吧-接下来我们详细看下Elasticsearch的评分是如何操作的,我们如何更精细的控制它, 来做更加定制化的推荐。
ElasticSearch中有一种复杂的查询,bool query,也叫做布尔查询,下面是一个bool查询的case,在项目中遇到的,做一下总结: case产生的背景: 保险业务,由于是分库分表的database...,所以在b端画面的一个查询数据的展示,是通过elasticsearch来检索命中文档的。...policyHolder投保人在es mapping中是一个object field policyInsurant被保人在es mapping中是一个nested field case的解决思路 模糊查询...,首先想到用es中的wildcard query,其次这个查询属于复杂的查询,那么我们可以采用query bool的查询方式,不了解该查询的可以去学习一下官方文档,然后再进行查询,query bool...查询方式官方文档 case的解决方案: GET my_index/_search { "query":{ "bool":{ "must":[
安装启动很简单,参考官网步骤:https://www.elastic.co/downloads/elasticsearch 为了介绍Elasticsearch中的不同查询类型,我们将对带有下列字段的文档进行搜索...: 为了展示Elasticsearch中不同查询的用法,首先在Elasticsearch里面创建了employee相关的documents,每本书主要涉及以下字段: first_name, last_name...你也可以指定minimum_should_match操作符来调整返回结果的相关性(tweakrelevance)。 2....Regexp Query(正则表达式查询) ElasticSearch还支持正则表达式查询,此方式提供了比通配符查询更加复杂的模式。...这是典型地基于文档(document)的重要性来抬高其相关性的方式。
filter 只过滤符合条件的文档,不计算相关系得分 must 文档必须符合must中所有的条件,会影响相关性得分 must_not 文档必须不符合must_not 中的所有条件 should 文档可以符合...查找和查询语句最匹配的文档,对所有文档进行相关性算分排序 query查询 bool中的must和should Filter 查找和查询语句匹配的文档 bool中的filter和must_not或者constant_score...bool查询同时包含should和must查询,文档不必满足should中的条件,但是如果满足条件,会增加相关性得分。...,布尔查询把多个子查询组合(combine)成一个布尔表达式,所有子查询之间的逻辑关系是与(and);只有当一个文档满足布尔查询中的所有子查询条件时,ElasticSearch引擎才认为该文档满足查询条件...": "1"}}, {"term": {"publish": true}} ] }} ] } } } 搜索java,elasticsearch
Elasticsearch的查询语言(DSL)真是不好写,偏偏查询的功能千奇百怪,filter/query/match/agg/geo各种各样,不管你是通过封装JSON还是通过python/java的api...最近发现了一个插件,Elasticsearch-SQL可以用sql查询Elasticsearch,感觉这个轮子造的真是好。...Elasticsearch-sql的项目地址:https://github.com/NLPchina/elasticsearch-sql 1、简介 Elasticsearch-sql实现的功能:...1)插件式的安装 2)SQL查询 3)超越SQL之外的查询 4)对JDBC方式的支持 2、插件式的安装 安装方法和elasticsearch-head的安装方法类似...安装成功以后我们就可以通过sql查询ES了。
1.DSL查询文档 elasticsearch的查询依然是基于JSON风格的DSL来实现的。...1.1.DSL查询分类 Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。...常见的有两种: fuction score:算分函数查询,可以控制文档相关性算分,控制文档排名 bool query:布尔查询,利用逻辑关系组合多个其它的查询,实现复杂搜索 1.5.1.相关性算分...而BM25则会让单个词条的算分有一个上限,曲线更加平滑: 小结:elasticsearch会根据词条和文档的相关度做打分,算法由两种: TF-IDF算法 BM25算法,elasticsearch5.1...如图: 要想认为控制相关性算分,就需要利用elasticsearch中的function score 查询了。
github 查询简介 叶子查询子句 叶子查询子句在特定字段中查找特定值,例如match,term或range查询。 这些查询可以自己使用。...复合查询子句 复合查询子句包装其他叶查询或复合查询,并用于以逻辑方式组合多个查询(例如bool或dis_max查询),或更改其行为(例如constant_score查询)。...bool查询 查询子句的行为会有所不同,具体取决于它们是在查询上下文中(Query)还是在过滤器(Filter)上下文中使用。...全文检索 在query context中,查询子句回答“此文档与该查询子句的匹配程度如何”的问题。除了确定文档是否匹配外,查询子句还计算_score元字段中的相关性得分。...过滤器上下文主要用于过滤结构化数据,例如: 该食品的生产日期是否在2018-2019之间 该商品的状态是否为"已上架" Ps:常用过滤器将由Elasticsearch自动缓存,以提高性能。
Elasticsearch在一个简单的JSON接口中用结构化查询来展现Lucene的绝大多数能力, 使用DSL查询能够让查询更加灵活, 精准, 易于阅读并且易于debug。...字段中找寻包含 elasticsearch 的成员 { "match": { "title": "Elasticsearch" } } 完整的查询请求如下 必须使用query关键字 , url...查询语句与过滤语句的区别 Query查询语句会询问每个文档的字段值与特定值的匹配程度如何,ES会给出一个相关性评分 _score , 并且 按照相关性对匹配到的文档进行排序。...Query查询语句不仅要查找相匹配的文档, 还需要计算每个文档的相关性, 所以一般来说查询语句要比过滤语句更耗时, 并且查询结果也不可缓存 Filter过滤查询语句在查询过程中,只判断该文档是否满足条件...不同的是, bool 过滤可以直接给出是否匹配成功, 而 bool 查询要计算每一个查询子句的 _score (相关性分值) must :: 查询指定文档一定要被包含。
领取专属 10元无门槛券
手把手带您无忧上云