首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Elasticsearch-py 2.3版本API翻译文档(一)

,用于限制结果 | | doc_type | 以逗号分隔类型列表,用于限制结果...| |---|---| |index | 用于限制结果逗号分隔索引列表| |doc_type | 以逗号分隔类型列表,用于限制结果| |body | 限制使用Query DSL指定结果查询(...| |field | 使用为此字段配置分析器(而不是传递分析器名称)| |filters | 用于分析逗号分隔过滤器列表| |format | 输出格式,默认'详细',有效选择是:'详细','文字...(支持通配符)| |fields | 用于fielddata和完成索引度量逗号分隔字段列表(支持通配符)| |groups | 搜索索引度量标准搜索组逗号分隔列表| |human | 是否以人类可读格式返回时间和字节值...默认为False| |level | 在集群,索引或分片级别汇总返回统计信息,默认'indices',有效选项为:'cluster','indices','shards'| |types | 索引索引度量标准逗号分隔文档类型列表

5.7K50
您找到你想要的搜索结果了吗?
是的
没有找到

触类旁通Elasticsearch:分析

图1给出例子中,有3种分词过滤器:第一个将分析转为小写,第二个删除停用词“and”,第三个将词条“tools”作为“technologies”同义词进行添加。...下面的例子在elasticsearch.yml配置文件中设置分析器。这里定制分析器和前面的一样,不过是在YAML里设置。...输出是一组这样映射列表,代表了处理后分词。实际上,就是这些分词将会被写入到索引中。上例中文本分析后获得8个分词。该例使用了标准分析器,每个分词被转为小写,每个句子结尾标点也被去除。...内置分析器 (1)标准分析器 标准分析器(standard analyzer)是ES默认文本分析器,包括标准分词器、标准分词过滤器、小写转换分词过滤器和停用词分词过滤器。...它也移除了逗号和句号这样标点符号。 curl -X GET "172.16.1.127:9200/_analyze?

1.3K31

ElasticSearch 分析分析器

分析过程 分析(analysis)过程如下: 首先,将一个文本块划分为适用于倒排索引独立词条(term) 然后对这些词进行标准化,提高它们’可搜索性’或’查全率’ 上面的工作就是由分析器(Analyzer...内建分析器 不过,Elasticsearch还内置了一些分析器,可以直接使用它们。下面我们列出了几个比较重要分析器,并演示它们有啥差异。...analyzer) 标准分析器Elasticsearch 默认使用分析器。...它们能够考虑到特定语言特点。例如,english 分析器自带一套英语停用词库(像 and 或 the 这些语义无关通用词),分析器将会这些词移除。...理解每个字段是如何定义,这样才可以让它们做正确事: 当你查询全文(full text)字段,查询将使用相同分析器来分析查询字符串,以产生正确词条列表

1.1K30

ElasticSearch权威指南学习(映射和分析)

倒排索引由在文档中出现唯一单词列表,以及对于每个单词在文档中位置组成。...字段为单独单词,我们把它们叫做词(terms)或者表征(tokens) 把所有的唯一词放入列表并排序,结果是这个样子 Term Doc_1 Doc_2 Quick X The X brown X...这个标记化和标准过程叫做分析(analysis) 分析和分析器 分析(analysis)是这样一个过程: 首先,标记化一个文本块为适用于倒排索引单独词(term) 然后标准化这些词为标准形式,提高它们...to semi-transparent by calling set_trans(5)" 标准分析器 它根据Unicode Consortium定义单词边界(word boundaries...默认Elasticsearch使用standard分析器,但是你可以通过指定一个内建分析器来更改它,例如whitespace、simple或english。

1.1K10

Elasticsearch “指纹”去重机制,你实践中用到了吗?

例如,考虑一个包含用户信息数据集,其中由于录入错误或不一致格式,同一用户多个记录可能以略微不同方式出现。...3.2 使用 Fingerprint 分析器详解 为了标准化并识别这些记录,我们可以在 Elasticsearch 中定义一个使用 Fingerprint 分析器索引。...my_fingerprint_analyzer,它使用 Elasticsearch Fingerprint 分析器类型,并配置了英语停用词列表。..."stopwords": "english" 是指在使用某些文本分析器(比如 Fingerprint 分析器)时,应用预定义英语停用词列表。...: 3.3 Fingerprint 分析器工作原理 从上面的结果不难看出,即使上述三条记录在某些细节上不同,它们也会生成相同指纹,从而可以被识别为代表同一用户记录。

23310

Elasticsearch概念及Search和Analyzer简单使用

倒排索引核心组成 单词词典(Term Dictionary) 记录所有文档单词,记录单词到倒排列表关联关系, 单词词典一般比较大,可以通过B+树或哈希拉链法实现,以满足性能插入查询....Analysis - 文本分析是把全文本转换一系列单词(term / token)过程,也叫分词 # Analysis是通过Analyzer来实现 # 可使用Elasticsearch内置分析器.../或者按需定制化分析器 # 除了在数据写入时转换词典,匹配Query语句时也需要用相同分析器对查询语句进行分析 Analyzer组成 分词器是专门处理分词组件, Analyzer由三部分组成:...分片路由信息 # 任意节点都能修改信息会导致数据不一致性....1,解决了over-sharding问题 # 影响搜索结果相关性打分,影响统计结果准确性. # 单个节点上过多分片,会导致资源浪费,同时也会影响性能.

1.1K30

第08篇-Elasticsearch分析和分析器

这就是小写令牌过滤器对令牌作用。 有关Elasticsearch随附令牌过滤器列表Elasticsearch中,令牌过滤器最常见用例之一是向单词添加同义词。...例如,Elasticsearch默认分析器标准分析器标准令牌生成器和两个令牌过滤器(标准令牌过滤器,小写和停止令牌过滤器)组合。...,因此Elasticsearch对此应用了默认分析器标准分析器”。...并且由于此类术语不存在,因此针对上述查询,elasticsearch也将返回零结果。 在Elasticsearch中就是“条件”查询情况。...因此,根据查询类型,搜索关键字将在搜索时间内进行分析(查询字段相同)。这称为搜索时间分析。 结论 在此博客中,我介绍了分析器基本组成部分以及Elasticsearch中发生分析类型。

3.1K00

第06篇-当Elasticsearch进行文档索引时,它是怎样工作

Elasticsearch系列文章,逐渐更新中,欢迎关注 0A.关于Elasticsearch及实例应用 00.SolrElasticSearch对比 01.ElasticSearch能做什么?...在上面给出示例中,我们有两个名为“ name”和“ age”键,它们值也是如此。...然后,对每个令牌应用特定过滤器(标准过滤过程包括所有拆分令牌下半部分)。因此,有效地,分析器完成分析后,密钥由一系列令牌组成。经过分析这些标记称为术语。...在传统方法中,我们必须遍历每个文档以及每个字段值以检索匹配搜索结果。...使用倒排索引,我们仅搜索一组选定术语,然后由于没有术语重复,如果找到匹配项,我们将在“文档”列中查找哪些文档中包含这些术语,然后将这些文档作为结果。因此,传统方法相比,节省了大量搜索时间。

2.2K00

一起学 Elasticsearch 系列-分词器

规范化:Normalization 在Elasticsearch中,"Normalization" 是指将文本数据转化为一种标准形式步骤。...normalization作用就是将文档规范化,提高召回率 举个例子: 假设我们希望在 Elasticsearch 中创建一个新索引,该索引包含一个自定义分析器,该分析器将文本字段转换为小写并移除变音符号...现在,当我们索引包含像 "Résumé" 这样文本时,它会被标准化为"resume",这样无论用户输入 "resume" 还是 "résumé" 或者 "RESUME", 都能匹配到正确结果。..._english_ 是一个预设停用词列表, //它包含了一些常用英语停用词,如 "and", "is", "the" 等。...我们可以使用synonyms_path 指定同义词规则路径,这个文件中列出了所有你定义同义词,每行都是一组同义词,各词之间用逗号分隔

22120

ElasticSearch原理实践

,并进行合并形成符合结果文档集 比对查询语句各个文档相关性得分,并按照得分高低返回 ElasticSearch分析器 分析 包含下面的过程: 首先,将一块文本分成适合于倒排索引独立词条 之后,将这些词条统一化为标准格式以提高它们...Customer Analyzer 自定义分词器 1、标准分析器 标准分析器Elasticsearch默认使用分析器。...": "simple", "text": "Set the shape to semi-transparent by calling set_trans(5)" } 简单分析器在任何不是字母地方分隔文本...全文查询,理解每个域是如何定义,因此它们可以做正确事: 当你查询一个 全文 域时, 会对查询字符串应用相同分析器,以产生正确搜索词条列表。...== 每个分片返回各自优先队列中 所有文档 ID 和排序值 给协调节点,它合并这些值到自己优先队列中来产生一个全局排序后结果列表

49730

学好Elasticsearch系列-分词器

Elasticsearch提供了许多内置分词器,如标准分词器(Standard Tokenizer)、简单分词器(Simple Tokenizer)、空白分词器(Whitespace Tokenizer...规范化:normalization 在Elasticsearch中,"normalization" 是指将文本数据转化为一种标准形式步骤。...举个例子: 假设我们希望在 Elasticsearch 中创建一个新索引,该索引包含一个自定义分析器,该分析器将文本字段转换为小写并移除变音符号。...现在,当我们索引包含像 "Résumé" 这样文本时,它会被标准化为"resume",这样无论用户输入 "resume" 还是 "résumé" 或者 "RESUME", 都能匹配到正确结果。...我们可以使用synonyms_path 指定同义词规则路径,这个文件中列出了所有你定义同义词,每行都是一组同义词,各词之间用逗号分隔

33920

学好Elasticsearch系列-分词器

规范化:normalization 在Elasticsearch中,"normalization" 是指将文本数据转化为一种标准形式步骤。...举个例子: 假设我们希望在 Elasticsearch 中创建一个新索引,该索引包含一个自定义分析器,该分析器将文本字段转换为小写并移除变音符号。...现在,当我们索引包含像 "Résumé" 这样文本时,它会被标准化为"resume",这样无论用户输入 "resume" 还是 "résumé" 或者 "RESUME", 都能匹配到正确结果。..._english_ 是一个预设停用词列表, //它包含了一些常用英语停用词,如 "and", "is", "the" 等。...我们可以使用synonyms_path 指定同义词规则路径,这个文件中列出了所有你定义同义词,每行都是一组同义词,各词之间用逗号分隔

27220

es中analyzer,tokenizer,filter你真的了解吗?

背景 最近在做搜索推荐相关需求,有一个场景中需要某一列能处理多种分词器分词匹配,比如我输入汉字或拼音或语义相近词都需要把匹配结果返回回来。...经过一番调研,最终我们选择了elasticsearch来处理数据索引搜索,在配置分词器时会发现大多分词器配置中都需要配置analyzer、tokenizer、filter,那么这三个东西分别代表着什么...本文咱们就来聚焦讨论一下analyzer、tokenizer、filter之间区别联系。 官方介绍 这里我们先来看下elasticsearch官方文档中一段介绍[4]。...,但配置为删除预定义英语停止词列表。...•my_text字段直接使用标准分析器,没有任何配置。此字段中不会删除任何停止词。由此产生词是:[ the, old, brown, cow ]。

6.2K60

ElasticSearch权威指南:基础入门(中)

分析分析器 分析 包含下面的过程: 首先,将一块文本分成适合于倒排索引独立 词条 , 之后,将这些词条统一化为标准格式以提高它们“可搜索性”,或者 recall 分析器执行上面的工作。...标准分析器Elasticsearch默认使用分析器。...它会产生 set, the, shape, to, semi, transparent, by, calling, set_trans, 5 简单分析器:简单分析器在任何不是字母地方分隔文本,将词条小写...指定分析器Elasticsearch在你文档中检测到一个新字符串域 ,它会自动设置其为一个全文 字符串 域,使用 标准 分析器对它进行分析。 你不希望总是这样。...请求体查询 —下文简称 查询—不仅可以处理自身查询请求,还允许你对结果进行片段强调(高亮)、对所有或部分结果进行聚合分析,同时还可以给出你是不是想找 建议,这些建议可以引导使用者快速找到他想要结果

5.6K41
领券