首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何提高Elasticsearch搜索的相关性

什么是相关性 首先需要了解什么是相关性?默认情况下,搜索返回的结果是按照 相关性 进行排序的,也就是最相关的文档排在最前。...相关性是由一个所谓的打分机制决定的,每个文档在搜索过程中都会被计算一个_score字段,这是一个浮点数类型,值越高表示分数越高,也就是相关性越大。...提高搜索的相关性 我们通过一个示例来展开这部分的讨论。.../_doc/3 { "content": "Known for its simple REST APIs, distributed nature, speed, and scalability, Elasticsearch...默认情况下,上面的查询ES会使用OR来分别查询每个term,也就是说上面的查询会被解析为 simple OR rest OR apis OR distributed OR nature 然后查询的结果相加的分数就是整个查询的分数

92610

干货 | ElasticSearch相关性打分机制

最近我们在做场馆搜索的功能时,接触到elasticsearch(简称es)搜索引擎。...查询正则因子(Query Normalization Factor) 查询正则因子(queryNorm)试图将查询正则化,这样就能比较两个不同查询结果。...ElasticSearch预定义了一些函数: weight 为每个文档应用一个简单的而不被正则化的权重提升值:当 weight 为 2 时,最终结果为 2 * _score field_value_factor...一般只用于数字类型,而衰减函数一般只用于数字、位置和时间类型 这时候就需要script_score了,它支持我们自己编写一个脚本运行,在该脚本中我们可以拿到当前文档的所有字段信息,并且只需要将计算的分数作为返回值传回Elasticsearch...此时可以编写Groovy脚本(Elasticsearch的默认脚本语言)来提高游泳相关场馆的分数。 return doc['category'].value == '游泳' ?

8.3K136
您找到你想要的搜索结果了吗?
是的
没有找到

Elasticsearch查询解析

背景        Elasticsearch(ES)可用于全文检索、日志分析、指标分析、APM等众多场景,而且搭建部署容易,后期弹性扩容、故障处理简单。...从使用的直观感受看,ES按照下图方式实现了分布式查询: [图1 查询基本流程] 查询可发送到任意节点,接收到某查询的节点会作为该查询的协调节点(Coordinating Node)。...关于这类问题的具体描述,可以参考如下文档: 被破坏的相关度 How Shards Affect Relevance Scoring in Elasticsearch 3....查询调度:根据查询请求条件,进行查询的Query Phase、Fetch Phase等执行流程,返回查询结果。        ...介绍完查询入口后,下面我们具体介绍查询执行过程中的调度部分。

2.7K90

Elasticsearch常用查询

前言 本文使用的Elasticsearch版本为6.5.4,上文主要介绍ES的各种查询,以满足更多的需求。ES的主要功能其实就是体现在这搜索查询上,所以我就总结一下,方便以后直接拿来就用。...terms查询 term query回去倒排索引中寻找确切的term(即精准查询),它并不知道分词器的存在。...match query知道「分词器的存在」,会对filed进行分词操作,然后在查询 match_all:查询所有文档 multi_match:可以指定多个字段 match_phrase:短语匹配查询,...Elasticsearch引擎首先分析(analyze)查询字符串,从分析后的文本中构建短语查询,这意味着必须匹配短语中的所有分词,并且保证各个分词的相对位置不变; # 分词的体现# 匹配的条件越多,相似度的值将会越高...i" } } } fuzzy实现模糊查询 value:查询的关键字 boost:查询的权值,默认值是1.0 min_similarity:设置匹配的最小相似度,默认值为0.5,对于字符串

60910

Elasticsearch查询解析

背景        Elasticsearch(ES)可用于全文检索、日志分析、指标分析、APM等众多场景,而且搭建部署容易,后期弹性扩容、故障处理简单。...从使用的直观感受看,ES按照下图方式实现了分布式查询: [图1 查询基本流程] 查询可发送到任意节点,接收到某查询的节点会作为该查询的协调节点(Coordinating Node)。...关于这类问题的具体描述,可以参考如下文档: 被破坏的相关度 How Shards Affect Relevance Scoring in Elasticsearch 3....查询调度:根据查询请求条件,进行查询的Query Phase、Fetch Phase等执行流程,返回查询结果。        ...介绍完查询入口后,下面我们具体介绍查询执行过程中的调度部分。

2.4K50

Elasticsearch探索:相关性打分机制 API

简介 官网地址:https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-function-score-query.html...这时就需要用到function_score 查询(function_score query) ,在 Elasticsearch 中function_score是用于处理文档分值的 DSL,它会在查询结束后对每一个匹配的文档进行一系列的重打分操作...GET /_search { "query": { "function_score": { "query": { "match": { "message": "elasticsearch...之前的两种方式都无法给字符串打分,但是如果我们自己写脚本的话却很简单,使用 Groovy(Elasticsearch 的默认脚本语言)也就是一行的事: return doc ['category'].value...1.1 : 1.0" } } } } 或是将脚本放在elasticsearch/config/scripts下,然后在查询语句中引用它: category-score.groovy

1.6K11

ElasticSearch 查询的秘密

Elasticsearch作为底层数据框架提供大数据量(亿级)的实时统计查询的方案设计工作,花了些时间学习Elasticsearch的基础理论知识,整理了一下,希望能对Elasticsearch感兴趣/...现在再看起来,似乎和传统数据库通过B-Tree的方式类似啊,为什么说比B-Tree的查询快呢?...Term Index B-Tree通过减少磁盘寻道次数来提高查询性能,Elasticsearch也是采用同样的思路,直接通过内存查找term,不读磁盘,但是如果term太多,term dictionary...联合索引 上面说了半天都是单field索引,如果多个field索引的联合查询,倒排索引如何满足快速查询的要求呢?...list里的ID到磁盘中查找Document信息的那步,因为Elasticsearch是分Segment存储的,根据ID这个大范围的Term定位到Segment的效率直接影响了最后查询的性能,如果ID

1.2K20

ElasticSearch Bool查询案例

ElasticSearch中有一种复杂的查询,bool query,也叫做布尔查询,下面是一个bool查询的case,在项目中遇到的,做一下总结: case产生的背景: 保险业务,由于是分库分表的database...,所以在b端画面的一个查询数据的展示,是通过elasticsearch来检索命中文档的。...policyHolder投保人在es mapping中是一个object field policyInsurant被保人在es mapping中是一个nested field case的解决思路 模糊查询...,首先想到用es中的wildcard query,其次这个查询属于复杂的查询,那么我们可以采用query bool的查询方式,不了解该查询的可以去学习一下官方文档,然后再进行查询,query bool...查询方式官方文档 case的解决方案: GET my_index/_search { "query":{ "bool":{ "must":[

1.1K20

Elasticsearch(七)——复合查询

filter 只过滤符合条件的文档,不计算相关系得分 must 文档必须符合must中所有的条件,会影响相关性得分 must_not 文档必须不符合must_not 中的所有条件 should 文档可以符合...查找和查询语句最匹配的文档,对所有文档进行相关性算分排序 query查询 bool中的must和should Filter 查找和查询语句匹配的文档 bool中的filter和must_not或者constant_score...bool查询同时包含should和must查询,文档不必满足should中的条件,但是如果满足条件,会增加相关性得分。...,布尔查询把多个子查询组合(combine)成一个布尔表达式,所有子查询之间的逻辑关系是与(and);只有当一个文档满足布尔查询中的所有子查询条件时,ElasticSearch引擎才认为该文档满足查询条件...": "1"}}, {"term": {"publish": true}} ] }} ] } } } 搜索java,elasticsearch

1.9K30

Elasticsearch搜索查询语法

github 查询简介 叶子查询子句 叶子查询子句在特定字段中查找特定值,例如match,term或range查询。 这些查询可以自己使用。...复合查询子句 复合查询子句包装其他叶查询或复合查询,并用于以逻辑方式组合多个查询(例如bool或dis_max查询),或更改其行为(例如constant_score查询)。...bool查询 查询子句的行为会有所不同,具体取决于它们是在查询上下文中(Query)还是在过滤器(Filter)上下文中使用。...全文检索 在query context中,查询子句回答“此文档与该查询子句的匹配程度如何”的问题。除了确定文档是否匹配外,查询子句还计算_score元字段中的相关性得分。...过滤器上下文主要用于过滤结构化数据,例如: 该食品的生产日期是否在2018-2019之间 该商品的状态是否为"已上架" Ps:常用过滤器将由Elasticsearch自动缓存,以提高性能。

1.2K20

Elasticsearch-05Elasticsearch查询与过滤

Elasticsearch在一个简单的JSON接口中用结构化查询来展现Lucene的绝大多数能力, 使用DSL查询能够让查询更加灵活, 精准, 易于阅读并且易于debug。...字段中找寻包含 elasticsearch 的成员 { "match": { "title": "Elasticsearch" } } 完整的查询请求如下 必须使用query关键字 , url...查询语句与过滤语句的区别 Query查询语句会询问每个文档的字段值与特定值的匹配程度如何,ES会给出一个相关性评分 _score , 并且 按照相关性对匹配到的文档进行排序。...Query查询语句不仅要查找相匹配的文档, 还需要计算每个文档的相关性, 所以一般来说查询语句要比过滤语句更耗时, 并且查询结果也不可缓存 Filter过滤查询语句在查询过程中,只判断该文档是否满足条件...不同的是, bool 过滤可以直接给出是否匹配成功, 而 bool 查询要计算每一个查询子句的 _score (相关性分值) must :: 查询指定文档一定要被包含。

1K10
领券