开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Elasticsearch -使用字段匹配仅用于boost，而不用于获取文档

Elasticsearch是一个开源的分布式搜索和分析引擎，它基于Apache Lucene构建而成。它提供了一个快速、可扩展和强大的全文搜索功能，可以用于各种应用场景，包括日志分析、实时数据分析、企业搜索等。

在Elasticsearch中，字段匹配主要用于搜索时对文档进行评分（boost），而不是用于获取文档本身。具体来说，字段匹配是通过计算文档与查询之间的相关性得分来确定文档的匹配程度。相关性得分是根据查询条件与文档中的字段进行匹配计算得出的，得分越高表示文档与查询越相关。

字段匹配可以通过多种方式进行，包括精确匹配、模糊匹配、范围匹配等。在搜索时，可以通过设置字段的boost值来调整字段匹配的权重，从而影响文档的相关性得分。boost值越高，表示该字段对于搜索结果的相关性影响越大。

Elasticsearch提供了丰富的查询语法和API，可以灵活地进行字段匹配和搜索操作。同时，它还支持实时索引和分布式架构，可以处理大规模数据集和高并发请求。

对于Elasticsearch的使用，腾讯云提供了云搜索引擎（Cloud Search）服务，它是基于Elasticsearch构建的一站式搜索解决方案。云搜索引擎提供了简单易用的管理界面和API，可以帮助用户快速搭建和管理搜索引擎，实现全文搜索功能。您可以通过腾讯云云搜索引擎产品介绍页面（https://cloud.tencent.com/product/cs）了解更多相关信息。

相关搜索:Elasticsearch嵌套排序-文档和用于排序的嵌套对象不匹配 MySQL2 -如何使用ASYNC/AWAIT仅获取结果而不包含字段 SQL查询，用于比较表A和B之间的字段是否有重复值，并使用表B中不匹配的记录将其追加到表A 仅返回匹配的数组项，而不返回ElasticSearch中的所有文档值腾讯云服务器带宽如何选择云服务器一键部署lnmp 云服务器安装docker 如何在云服务器里面键网站云服务器怎么连接私有ip 云服务器有两个ip怎么用

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一起学Elasticsearch系列-Query DSL

源数据：source _source字段包含索引时原始的JSON文档内容，字段本身不建立索引（因此无法进行搜索），但是会被存储，所以当执行获取请求是可以返回_source字段。...match_all：匹配所有结果的子句 match_all是Elasticsearch中的一个查询类型，用于获取索引中的所有文档。...如果你只是希望所有单词都存在，而不关心它们的顺序或精确出现方式，那么你应该使用 match 查询。 Term Query 精确查询用于查找包含指定精确值的文档，而不是执行全文搜索。...相比之下，过滤器只关心文档是否匹配 - 没有“部分匹配”，只有“匹配”或“不匹配”。过滤器可以被缓存：由于过滤器不需要计算得分，因此它们的结果可以被缓存起来用于之后的搜索请求，这可以大大提高性能。...如果相同的 filter 查询再次执行，Elasticsearch 可以直接从缓存中获取这个 bitset，而不需要再次遍历所有的文档来找出哪些文档符合这个 filter。

3992 0

Elasticsearch Mapping

Elasticsearch Mapping Elasticsearch Mapping用于定义文档。比如：文档所拥有的字段、文档中每个字段的数据类型、哪些字段需要进行索引等。...2.6 enabled Elasticsearch尝试索引所有字段，但有时你只想存储该字段而不索引该字段，即无需对该字段进行搜索或者聚合操作，那么你就可以将enabled值置为false。...enabled参数仅适用于mapping中的顶级字段且数据类型必须为object。若enabled值为true，那么Elasticsearch会跳过对其内容进行解析，但依然会存储该字段。...假设文档中有三个字段，分别是：title、date和content，其中content字段内容很长，可能你仅仅想获取title和date字段值，那么这时你就需要将其显式置为true，具体如下： PUT...，keyword数据类型比较适合结构化的文本，如：邮箱地址、域名、标签等；从搜索的角度看，keyword数据类型适合分词级别的精确匹配，而不适用于全文检索。

8373 0

Elasticsearch(六)——Query

常用的参数如下：字段描述 -q 指定查询的语句，语法Query String Syntax -df q 中不指定字段时默认查询字段 -sort 排序 -timeout 指定超时时间，默认不超时 -from...,size 用于分页 GET /_index/_search?...q=tom&df=user&sort=age:asc&from=4&size=10&timeout=1s 上面的语句意思查询userz字段包含tom的文档，结果按照age升序排列，返回第5-14个文档，...如果超过1s没有结束，则超时结束泛查询等效于在所在字段去匹配改term URI Search 指定字段查询 +代表必须包含-(减号)代表不包含 GET blog/paper/_search?...":3 } }}, {"match": { "title": { "query": "elasticsearch", "boost

8212 0

学好Elasticsearch系列-Query DSL

源数据：_source source字段包含索引时原始的JSON文档内容，字段本身不建立索引（因此无法进行搜索），但是会被存储，所以当执行获取请求是可以返回source字段。...也就是说，"desc"和"tags"字段仍然会被索引和存储，只是在获取源数据时不会被返回。在mapping中定义这种方式不推荐，因为mapping不可变。...这通常用于在没有特定搜索条件时获取所有的文档，或者与其他查询结合使用（如过滤器）。...也就是说，如果你在使用 term 查询时输入了一个完整的句子，它将尝试查找与这个完整句子精确匹配的文档，而不是把句子拆分成单词进行匹配。...如果相同的 filter 查询再次执行，Elasticsearch 可以直接从缓存中获取这个 bitset，而不需要再次遍历所有的文档来找出哪些文档符合这个 filter。

2294 0

学好Elasticsearch系列-Query DSL

源数据：_source source字段包含索引时原始的JSON文档内容，字段本身不建立索引（因此无法进行搜索），但是会被存储，所以当执行获取请求是可以返回source字段。...也就是说，"desc"和"tags"字段仍然会被索引和存储，只是在获取源数据时不会被返回。在mapping中定义这种方式不推荐，因为mapping不可变。...这通常用于在没有特定搜索条件时获取所有的文档，或者与其他查询结合使用（如过滤器）。...也就是说，如果你在使用 term 查询时输入了一个完整的句子，它将尝试查找与这个完整句子精确匹配的文档，而不是把句子拆分成单词进行匹配。...如果相同的 filter 查询再次执行，Elasticsearch 可以直接从缓存中获取这个 bitset，而不需要再次遍历所有的文档来找出哪些文档符合这个 filter。

2221 0

触类旁通Elasticsearch：打分

而每个词条的得分是该词条在文档 d 中的词频的平方根，乘以该词逆文档频率的平方和，乘以该文档字段的归一化因子，乘以该词条的提升权重。”...下面代码会搜索“elasticsearch”和“big data”，而“elasticsearch”被boost了3倍。...”没有出现在ID为4的文档的description字段中，得分为0，解释了为什么这篇文档和查询没有匹配成功。...”关键词的文档，然后对获取的前20项结果重新计算得分，它使用了高slop值的phrase查询。...注意，普通的boost字段按照标准化来增加分数，而weight是真正将得分乘以确定的数值。下面的代码在初始查询得到的结果中，将description字段中包含“hadoop”的文档得分提升1.5倍。

1.9K1 0

Elasticsearch 之 Filter 与 Query 有啥不同？

：必须匹配，贡献算分 should：选择性匹配，贡献算分 must_not：查询字句，必须不能匹配 filter：必须匹配，不贡献算分 ?...进行打分，negative_boost 是用于降低与 negative 匹配文档的相关性算分的。...用一个表格来总结下 Query Context 和 Filter Context 的区别： Context Type 含义使用方式 Query 查找与查询语句最匹配的文档，对所有文档进行相关性算分并排序...ES 会构建一个文档匹配过滤器的位集 bitset（用来标识一个文档对一个 filter 条件是否匹配，如果匹配就是 1，不匹配就是 0），下次再有这个 filter 条件过来的时候就不用重新扫描倒排索引...在 bool 查询中，查询结构是对相关性算分有影响的，可以通过嵌套的方式修改不同字段在查询中的权重以及直接通过指定字段的 boost 值来控制在搜索中的权重，另外使用 Boosting Query 可以提升搜索的精准性

1.3K1 0

ElasticSearch实战指南必知必会：安装中文分词器、ES-Python使用、高级查询实现位置坐标搜索以及打分机制

默认情况下，k1设置为1.2，而b则被设置为0.75 discount_overlaps的设置用于告诉es，在某个字段中，多少个分词出现在同一位置，是否应该影响长度的标准化，默认值是true。...最后，boost是应用与词条的。因此，再被boost的字段中如果匹配上了多个词条，就意味着计算多次的boost，这将会进一步增加字段的权重，可能会影响最终的文档得分。现在我们再来介绍另一种方式。...也只有在bool查询中，boost更有意义。 4.5.3 跨越多个字段的查询 boost也可以用于multi_match查询。...需要注意的是：在使用boost的时候，无论是字段或者词条，都是按照相对值来boost的，而不是乘以乘数。...所以，除了在调试时可以使用，生产环境下，应避免使用explain。更多优质内容请关注公号：汀丶人工智能；会提供一些相关的资源和优质文章，免费获取阅读。

6643 0

ElasticSearch实战指南必知必会：安装分词器、高级查询、打分机制

默认情况下，k1设置为1.2，而b则被设置为0.75discount_overlaps的设置用于告诉es，在某个字段中，多少个分词出现在同一位置，是否应该影响长度的标准化，默认值是true。...最后，boost是应用与词条的。因此，再被boost的字段中如果匹配上了多个词条，就意味着计算多次的boost，这将会进一步增加字段的权重，可能会影响最终的文档得分。现在我们再来介绍另一种方式。...也只有在bool查询中，boost更有意义。4.5.3 跨越多个字段的查询boost也可以用于multi_match查询。...需要注意的是：在使用boost的时候，无论是字段或者词条，都是按照相对值来boost的，而不是乘以乘数。...所以，除了在调试时可以使用，生产环境下，应避免使用explain。更多优质内容请关注公号：汀丶人工智能；会提供一些相关的资源和优质文章，免费获取阅读。

4255 0

elasticsearch：ES评分规则详解

次数越多，分数越高如果您不关心术语在字段中出现的频率，而您只关心该术语是否存在，那么您可以在字段映射中禁用术语频率： (2)idf-- 逆文档频率该术语在集合中的所有文档中出现的频率是多少...待匹配内容会根据数组向量形成一条线，而文档中与其匹配的内容也会形成对应的线，那么线越靠近就说明结果越匹配。...每个文档的查询规范化因子相同，无法更改。 2.coord--协调因子用于奖励包含较高百分比查询词的文档。文档中出现的查询词越多，文档与查询匹配的可能性就越大，分数越高。...也就是同时包含“青年”“大学”“学习”的文档的分数不仅仅是三者相加的分数，而是会使用协调因子将分数乘以文档中匹配项的数量，然后除以查询中的项总数。...3.tf--词频 4.idf--逆文档频率 5.t.getBoost()--查询提升用于增加查询中某个字段的重要性：https://www.elastic.co/guide/en/elasticsearch

1.1K1 0

ElasticSearch可扩展的开源弹性搜索解决方案

pretty=true' -d @query.json C.基本查询 1.term：匹配给定字段有某个词项的文档 2.terms：匹配包含某些词项的文档 3.match：提取参数中难写的取值，分析这些值...字段就可以在任何搜索中使用过滤器 2.range：将搜索范围限制在字段取值在给定界限内的文档 3.exists：只选择有指定字段的文档 4.missing：与exists相反，还可以指定将哪些值作为空值处理...、and、or和not可以组合过滤器 10.使用"_name"可以命名过滤器 E.复合查询 1.bool：should可以匹配也可以不匹配、must必须匹配、must_no必须不匹配 2.boosting...：将两个查询封装在一起，并降低其中一个查询所返回文档的分值 3.constant_score：用于封装另一个查询（过滤器），被封闭查询（过滤器）返回的每个文档都得到一个恒定分值，允许我们严格控制赋予被查询或过滤器匹配的每个文档的分值...：doc，访问基于计算分值或者字段取值找到的当前文档；_source，可以访问当前文档的源，以及在其中定义的取值；_fields，用于访问文档中的字段取值三、扩展结构与搜索 1.关闭动态映射：dynamic

1.5K3 0

《读书报告 – Elasticsearch入门》----Part II 深入搜索（2）

精度控制所有的 must 子句必须匹配, 并且所有的 must_not 子句必须不匹配, 但是多少 should 子句应该匹配呢?...注意： boost参数用于提高子句的相对权重（boost值大于1）或者降低子句的相对权重（boost值在0-1之间），但是提高和降低并非是线性的。...如果你自己实现了没有基于TF/IDF的得分模型，但是你想得到更多的对于提高得分过程的控制，你可以使用function_score查询来调整一个文档的boost值而不用通过标准的步骤。...而像‘title’，‘body’这些字段，会被认为之间存在竞争。文档在同一个字段上会有许多值，所以得分应该来自最匹配的字段。...一个字段可能包含非词根的版本，另一个是带着重音符的原词，第三个可能使用小招牌来提供相似词的信息这些字段作为匹配文档的增加相关性得分标记，匹配的字段越多，越好。

1.2K2 0

Elasticsearch：使用 function_score 及 soft_score 定制搜索结果的分数

在使用 Elasticsearch 进行全文搜索的时候，默认是使用 BM25 计算的 _score 字段进行降序排序的。...尽管这个分数没有多大实际的意思，但是它可以让我们每次进入一个网页看到不同的文档，而不是严格按照固定的匹配而得到的固定的结果。...与使用 script_score 函数类似，但是它避免了脚本编写的开销。如果用于多值字段，则在计算中仅使用该字段的第一个值。...missing 如果文档没有该字段，则使用该值。就像从文档中读取一样，修饰符和因数仍然适用于它。...Elasticsearch 评分算法，还可以用于完全替代它。

1.5K5 1

ElasticSearch进阶：一文全览各种ES查询在Java中的实现

7.3以后，已经不推荐使用TransportClient这个client，取而代之的是Java High Level REST Client。...SQL： select * from person where name = '张无忌'; 而使用ES查询语句却很不一样（注意查询字段带上keyword）： GET /person/_search {...5.0以后，string类型有重大变更，移除了string类型，string字段被拆分成两种新的数据类型: text用于全文搜索的，而keyword用于关键词搜索。...精度控制：所有 must 语句必须匹配，所有 must_not 语句都必须不匹配，但有多少 should 语句应该匹配呢？...；而filter是先判断是否满足查询条件，如果不满足会缓存查询结果（记录该文档不满足结果），满足的话，就直接缓存结果，filter不会对结果进行评分，能够提高查询效率。

16.6K9 8

elasticsearch-DSL高级查询语法

多字段匹配 multi_match-多字段匹配：如搜索"小云" 只要name或者car字段中包含 "小云" OR "小" OR "云" 等分词都会被查找出来 GET /sunny/user/_search...结构查询语法精确匹配 term-将按照存储在倒排索引中的确切字词进行操作，这些查询通常用于数字，日期和枚举等结构化数据，而不是全文本字段。...布尔查询》比如，query的时候，会先比较查询条件，然后计算分值，最后返回文档结果；而filter则是先判断是否满足查询条件，如果不满足，会缓存查询过程（记录该文档不满足结果）；满足的话，就直接缓存结果...可以降低日常使用的高频率词的权重。字段长度归一值：查询字段的长度。字段长度越长，查询词权重越高，反之越低。...constant_score复合查询将查询内部的结果文档得分都设定为1或者boost的值，多用于结合bool查询实现自定义得分（将查询的评估固定下来，不支持match，只支持filter）、布尔查询

3.5K3 0

Elasticsearch探索：相关性打分机制 API

只要一个文档与查询匹配，Lucene就会为查询计算分数，然后合并每个匹配术语的分数。这里使用的分数计算公式叫做实用计分函数（practical scoring function）。...(t) 是术语 t 的逆向文档频次 · t.getBoost() // t.getBoost() 是查询中使用的 boost · norm(t,d...这时就需要用到function_score 查询（function_score query），在 Elasticsearch 中function_score是用于处理文档分值的 DSL，它会在查询结束后对每一个匹配的文档进行一系列的重打分操作...他最大的用途应该就是和过滤器一起使用了，因为过滤器只会筛选出符合标准的文档，而不会去详细的计算每个文档的具体得分，所以只要满足条件的文档的分数都是 1，而 weight 可以将其更换为你想要的数值。...，field_value_factor一般只用于数字类型，而衰减函数一般只用于数字、位置和时间类型这时候就需要script_score了，它支持我们自己编写一个脚本运行，在该脚本中我们可以拿到当前文档的所有字段信息

1.6K1 1

Elasticsearch 8.X：这个复杂的检索需求如何实现？

扩展说明一下：在 Elasticsearch 中，match_phrase 查询用于搜索精确的短语，而 slop 参数定义了词条之间的允许的最大距离。...在多字段和多关键词的情况下，使用 Painless 脚本可能是最直接的方法来精确控制排序逻辑，但通常会牺牲一些性能。简而言之，Elasticsearch 本身可能不是最适合解决这一具体需求的工具。...脚本实现逻辑解读：步骤描述 1 通过doc['title.keyword'].value获取当前文档的"title"字段值并存储在title变量中。...通过上述脚本，Elasticsearch 会优先返回那些"title"字段中"小学"出现在"天天"之前的文档。读到这里，读者可能会问，这换个词咋办？的确这不是普适的解决方案，而是定制的解决方案。...更复杂的需求（例如，处理多个字段或更多的关键词）可能需要更复杂的脚本。但切记：如果排序逻辑变得太复杂或影响性能，可能需要考虑在应用层进行后处理，而不是依赖 Elasticsearch 的内部排序。

3986 0

ES 自定义打分

在很多场景下，我们不仅需要搜索到匹配的结果，还需要能够按照某种方式对搜索结果重新打分排序。例如： •搜索具有某个关键词的文档，同时考虑到文档的时效性进行综合排序。...score 自定义打分过程为了行文方便，本文把 ES 对 query 匹配的文档进行打分得到的 score 记为 query_score ，而最终搜索结果的 score 记为 result_score...例如，搜索标题包含 elasticsearch 的文档。...•modifier : 计算函数，为了避免分数相差过大，用于平滑分数，可以是以下之一：•none : 不处理，默认•log : log(factor * field_value)•log1p : log...，doc['field'].value 就是使用字段值。

2.1K3 1

Elasticsearch探索：Suggester API（一）

，在 ES 中通过 Sugester API 实现的原理：将输入的文档分解为 Token，然后在索引的字段里查找相似的 Term 并返回根据不同的使用场景，ES 设计了 4 种类别的 Suggesters...默认为5 min_doc_freq：suggestion 应该出现的文档数量的最小阈值。这可以指定为绝对数字或文档数量的相对百分比。这可以通过仅 suggesting 高频项来提高质量。...min_doc_freq：suggest应出现的最小文档数阈值。可以将其指定为绝对数量或相对数量的文档数。通过仅suggest高频项可以提高质量。默认为0f且未启用。...分片级别文档频率用于此选项。 pre_filter：一个过滤器（分析器），应用于传递给此候选generator的每个token。在生成候选对象之前，此过滤器将应用于原始token。...下面的示例显示了具有两个generator的词组 suggest 调用：第一个generator使用包含普通索引项的字段，第二个generator使用包含使用反向过滤器索引的项的字段（token按相反顺序索引

5.2K2 3

ElasticSearch 进阶：一文全览各种 ES 查询在 Java 中的实现

7.3以后，已经不推荐使用TransportClient这个client，取而代之的是Java High Level REST Client。...01 测试使用的数据示例首先是，Mysql中的部分测试数据： Mysql中的一行数据在ES中以一个文档形式存在： { "_index" : "person", "_type" : "_doc...5.0以后，string类型有重大变更，移除了string类型，string字段被拆分成两种新的数据类型: text用于全文搜索的，而keyword用于关键词搜索。...精度控制：所有 must 语句必须匹配，所有 must_not 语句都必须不匹配，但有多少 should 语句应该匹配呢？...；而filter是先判断是否满足查询条件，如果不满足会缓存查询结果（记录该文档不满足结果），满足的话，就直接缓存结果，filter不会对结果进行评分，能够提高查询效率。

2.4K1 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭