文章/答案/技术大牛

发布

Elasticsearch-Python 2.7-为分析器配置索引

Elasticsearch是一个开源的分布式搜索和分析引擎，它可以用于快速搜索、分析和存储大量的数据。它基于Apache Lucene搜索引擎库，并提供了RESTful API来进行数据的索引、搜索和分析。

Python 2.7是Python编程语言的一个版本，它是一种高级、通用、解释型的编程语言，被广泛应用于各种领域的开发工作。

为分析器配置索引是指在使用Elasticsearch进行数据索引和搜索时，可以通过配置分析器来定义如何处理文本数据。分析器可以将文本数据进行分词、过滤和标准化等操作，以便更好地进行搜索和分析。

在Elasticsearch中，可以使用Python 2.7编写代码来配置索引的分析器。具体步骤如下：

安装Elasticsearch-Python库：Elasticsearch-Python是一个Python客户端库，用于与Elasticsearch进行交互。可以使用pip命令进行安装。

pip install elasticsearch

导入Elasticsearch库：在Python代码中，使用import elasticsearch语句导入Elasticsearch库。
连接到Elasticsearch集群：使用elasticsearch.Elasticsearch类创建一个Elasticsearch客户端对象，并指定连接的Elasticsearch集群的地址。

from elasticsearch import Elasticsearch

es = Elasticsearch('http://localhost:9200')

创建索引并配置分析器：使用es.indices.create方法创建一个新的索引，并通过analysis参数配置分析器。

index_name = 'my_index'

settings = {

   'settings': {

       'analysis': {

           'analyzer': {

               'my_analyzer': {

                   'type': 'custom',

                   'tokenizer': 'standard',

                   'filter': ['lowercase', 'stop']

}

es.indices.create(index=index_name, body=settings)

上述代码中，创建了一个名为my_index的索引，并配置了一个名为my_analyzer的分析器。该分析器使用标准分词器（tokenizer）进行分词，并应用了小写化（lowercase）和停用词过滤器（stop）。

通过以上步骤，我们成功地使用Python 2.7配置了一个具有自定义分析器的Elasticsearch索引。在实际应用中，可以根据具体需求进行更复杂的分析器配置，以满足不同的搜索和分析需求。

腾讯云提供了Elasticsearch的托管服务，称为Tencent Cloud Elasticsearch。您可以通过以下链接了解更多关于Tencent Cloud Elasticsearch的信息和产品介绍：

Tencent Cloud Elasticsearch

Elasticsearch-Python 2.7-为分析器配置索引

、、、

我正在尝试使用python API构建一个索引，使用以下代码(特别是我正在尝试配置一个分析器)："settings": { "analyzer": {我认为问题出在索引的创建上。我使用了正确的语法吗？

浏览 1提问于2016-07-17得票数 0

回答已采纳

1回答

如何将默认索引分析器配置为内置索引分析器

在字段映射中，我可以这样设置分析器： { ... ,"analyzer": "german", ... } 我会在创建索引时为整个索引设置一个分析器。根据文档，我需要配置“默认”索引： "settings": { "analyzer": { What do}

浏览 21提问于2019-02-08得票数 0

1回答

Solr -配置SeachHandler的最小匹配值= 100%的SeachComponent，仍然忽略搜索查询中的停止词

、

我们的索引分析器配置了solr.StopFilterFactory。所以停止词没有索引。我们还将查询分析器配置为solr.StopFilterFactory，因为我们希望从搜索查询术语中忽略停止词。在solrconfig.xml中，选择SearchHandler配置为使用SearchComponent参数最小匹配= 100 % <requestHandler name="/select" class

浏览 3提问于2016-10-19得票数 3

回答已采纳

1回答

如何创建弹性搜索节点，指定用于索引和搜索的默认搜索分析器

、

声明如下：默认的逻辑名称允许配置分析器，用于索引和搜索API。default_index逻辑名称可用于配置仅在索引时使用的默认分析器，而default_search可用于配置仅在搜索时使用的默认分析器。换句话说，可以配置索引时使用的默认分析器，以及搜索时使用的默认分析器。和它的答案帮助我创建了一个具有默认索引分析器的节点，这个节点(简化的)可

浏览 2提问于2015-08-11得票数 1

回答已采纳

1回答

Azure认知搜索-什么时候使用不同的搜索和索引分析器？

、、、、

我试图了解配置用于Azure搜索和索引的不同分析器的目的是什么。请参阅：最初，我认为它会在搜索查询本身上应用类似的过程，但在这个阶段设置一个与文档索引不同的分析器不会完全破坏搜索结果吗？如果索引分析器将所有内容小写，但搜索分析器没有小写查询，这不意味着您将永远得不到大写字符查询的

浏览 6提问于2022-11-12得票数 0

回答已采纳

1回答

如何通过REST在neo4j全文api中使用配置Lucene标准分析器

、

如何通过REST api将Neo4j全文索引中的分析器设置为标准分析器，而不是空白分析器。 "analyzer": "org.apache.lucene.analysis.standard.Standard

浏览 0提问于2012-11-18得票数 0

1回答

在“字符串”搜索中，带有轮胎的ElasticSearch与nGrams不匹配，只与“文本”匹配

、、、

因此，我一直试图将nGram匹配添加到我的ElasticSearch索引中，但遇到了以下问题。有什么方法可以让普通的query_string搜索来查找所有索引字段并匹配ngram

浏览 2提问于2012-08-24得票数 1

回答已采纳

1回答

如何在compass-lucene搜索中使用分析器

、、、

如何在指南针中索引和搜索数据时添加指南针分析器。我正在对指南针使用基于架构的配置。我希望使用不带stopwords.Because的StandardAnalyzer我希望按原样索引数据，而不忽略and、OR、in等搜索项。默认分析器将忽略我给出的索引数据中的AND、OR、IN。如何通过代码或xml配置snowball analyzer？如果有人能给我一个例子的话。

浏览 2提问于2010-09-20得票数 0

回答已采纳

1回答

用弹性搜索检索标签内容和连字符

、、、、

我们在应用程序中配置了弹性搜索，并配置了空白分析器。这些单词在空格上标记，因此像<fantastic> project这样的名称被索引为而ABC 123-def项目的索引为标准分

浏览 2提问于2016-03-01得票数 1

回答已采纳

2回答

Apache :正确使用CompoundWordFilter

我正在努力弄清楚如何为我的应用程序配置Solr。我正在索引PDF文档(大部分是德语)，我使用dismax查询来查询Solr。我下载了一个德语字典文件，并将DictionaryCompoundWordTokenFilter应用于索引分析器和查询分析器。问题是，过滤器将查询分解为非常的小部件(例如，"Firmenprofil“中的"pro”，这会导致返回各种包含"Product“之类单词的文档.)。我尝试从查询分析器中删除筛选器，这导致solr

浏览 6提问于2011-08-27得票数 0

回答已采纳

1回答

如何使Elasticsearch索引全局区分大小写？

、

有一些示例(例如 )可以说明如何为ES中的特定字段定义分析器。我加载了大量具有不同字段的数据类型，因此按名称对字段设置分析器是完全不切实际的。我之前使用的是Solr，通过对我所有的数据使用dynamicFields，并编辑schema.xml来修改“LowerCaseFilterFactory”字段类型以从分析器中删除文本，从而完成了全局区分大小写的搜索

浏览 0提问于2012-09-12得票数 2

回答已采纳

1回答

Elasticsearch:查询时的自定义分析器

我试图在查询时提供分析器，这是不工作的。创建索引 "settings": { "valid": true, "explanation": &quo

浏览 0提问于2019-07-26得票数 0

1回答

使用不同的查询和索引时间分析器创建elasticsearch索引

尽管有文档记录，但没有关于如何使用索引时间和不同的查询时间分析器创建索引的工作示例。有什么不对的？我可以确认在索引类型上设置了默认分析器名称： "mappings": { "

浏览 0提问于2016-02-03得票数 1

回答已采纳

1回答

在Solr中，为什么要对索引和查询使用不同的分析器呢？

、

为什么你想要使用不同的分析器来进行索引和查询，有什么重要的原因吗？例如，在示例schema.xml文件中，对于text_en_splitting，索引分析器不执行同义词扩展，但查询执行同义词扩展。这仅仅是为了使索引尽可能小吗？类似地，对于WordDelimiterFilterFactory，索引分析器的catenateWords=为“1”，catenateNumbers=为“1”，而查询分析器将它们设置为</

浏览 0提问于2012-04-17得票数 4

回答已采纳

1回答

如何使用elasticsearch搜索多个字段？

、、

如何使用elasticsearch搜索多个字段？我尝试过许多疑问，但都没有结果。我希望搜索是不区分大小写的，一个字段比另一个字段更重要。我的查询如下： query: { query: `*SOME_CONTENT_HERE*`, default_operator: 'OR', },

浏览 0提问于2018-03-14得票数 2

回答已采纳

1回答

AWS Elasticsearch:关闭putSettings的索引‘是不允许的’？

、、、

我的Elasticsearch索引应该有电子邮件分析器，以便以正确的方式存储电子邮件。出于这个原因，我在配置中创建了新的分析器，并调用方法client.indices.putSettings (Node.js)。但是官方文档说，首先我们需要调用索引的_close方法，然后我们应该调用putSettings。当我使用Docker image时，这些方法执行起来没有任何问题。如何将我的自定义设置设置为Amazon Elasticsearch Service？

浏览 3提问于2019-07-29得票数 1

1回答

ElasticSearch -从标准词干机中排除特殊字符

我使用标准分析器作为我的ElasticSearch索引，并且我注意到当我在其中搜索带有%的查询时，分析器会删除%作为词干分析器步骤的一部分(在查询"2%牛奶“时) "position": 1 ]意思是，2%变成了2 我想使用标准词干器来减少标点符号，我不想使用空格词干器或其他不标准的词根，但我确实希望在索引中使用是否有一种方法可以配

浏览 2提问于2020-02-04得票数 3

回答已采纳

2回答

防止CEDET语义解析某些文件类型

、、

我必须使用一个C/C++构建环境，该环境将中间文件拖到各处：是否有可能阻止分析器加载这些文件？我找不到任何配置选项来定义由后台分析器解析的文件类型。

浏览 4提问于2014-12-05得票数 2

回答已采纳

1回答

为logstash中的新字段设置弹性搜索分析器

、、

但是，在这里，我想知道如何为这个特定的字段设置分析器。这怎么能在逻辑仓库里完成。

浏览 2提问于2013-12-08得票数 6

回答已采纳

2回答

使用Lucene进行Neo4j查询

、、、

我对每篇文章的内容进行了索引，并在索引上进行了查询，如下所示 val articles = article_content_index.query("article_content", search string

浏览 3提问于2013-08-06得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Elasticsearch-Python 2.7-为分析器配置索引

相关·内容

Elasticsearch-Python 2.7-为分析器配置索引

如何将默认索引分析器配置为内置索引分析器

Solr -配置SeachHandler的最小匹配值= 100%的SeachComponent，仍然忽略搜索查询中的停止词

如何创建弹性搜索节点，指定用于索引和搜索的默认搜索分析器

Azure认知搜索-什么时候使用不同的搜索和索引分析器？

如何通过REST在neo4j全文api中使用配置Lucene标准分析器

在“字符串”搜索中，带有轮胎的ElasticSearch与nGrams不匹配，只与“文本”匹配

如何在compass-lucene搜索中使用分析器

用弹性搜索检索标签内容和连字符

Apache :正确使用CompoundWordFilter

如何使Elasticsearch索引全局区分大小写？

Elasticsearch:查询时的自定义分析器

使用不同的查询和索引时间分析器创建elasticsearch索引

在Solr中，为什么要对索引和查询使用不同的分析器呢？

如何使用elasticsearch搜索多个字段？

AWS Elasticsearch:关闭putSettings的索引‘是不允许的’？

ElasticSearch -从标准词干机中排除特殊字符

防止CEDET语义解析某些文件类型

为logstash中的新字段设置弹性搜索分析器

使用Lucene进行Neo4j查询

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐