映射到同一分片的Elasticsearch路由键的行为

关于路由的搜索，它也给了我不同路由关键字的数据。请帮帮我。我在v2.0中设置了路由，并使用路由键查询了查询，示例如下： GET myindex/mytype/_search?routing=5 { "query": { "match_all": {} } } 我用routing key=5搜索数据，但我得到的输出是： hits": [ { "_index": "goqii", "_type": "nazar",

浏览 0提问于2016-03-21得票数 0

1回答

是否可以在本地生成tire+elasticsearch索引，稍后将索引文件推送到服务器？

、

它在生成索引时会消耗内存。是否可以在本地生成tire+elasticsearch索引，稍后将索引文件推送到服务器？谢谢

浏览 5提问于2012-10-30得票数 0

回答已采纳

1回答

Elasticsearch中的刷新是原子的吗？

场景:我将索引刷新间隔设置为-1 (不自动刷新)。我使用bulk和refresh=true将20个文档添加到索引中。所有文档是否同时可见？问题是Elasticsearch刷新是原子的吗？自上次刷新以来对索引所做的所有更改是否一次全部可见？

浏览 19提问于2019-10-15得票数 0

2回答

elasticsearch父条目必须在其子条目之前存在吗？

我在elasticsearch中使用父关系，我想知道父关系是否必须先于子关系存在。当我添加一个id为尚未存在的父元素的子元素时，Elasticsearch不会抱怨。然而，它看起来(我还没有完全验证它)，一旦父元素被添加，有时"has_parent“查询会返回条目，而有时不会。我一直在寻找答案，但还没有找到。有谁有线索吗？

浏览 1提问于2014-08-13得票数 2

2回答

使用大量连接时Kinesis出错

、、、、

我正在使用Kinesis存储从安装在EC2服务器上的Jmeter发送的记录。问题是，当我启动7200个线程并在我的Kinesis流上使用1个共享时，一切都正常工作。如果我启动了9000个线程，我会收到这个错误 Rate exceeded for shard shardId-000000000001 in stream Jmeter under account 769870455028. (Service: AmazonKinesis; Status Code: 400; Error Code: ProvisionedThroughputExceededException; Request ID

浏览 2提问于2015-05-21得票数 1

1回答

nginx作为elasticsearch负载均衡器性能较低

、、

我正在尝试将nginx配置为Elastic Search Cluster (1.3.7版)前面的负载均衡器。我正在从3台基准服务器到集群中的3个elasticsearch节点进行测试。使用nginx作为LoadBalancer时，性能下降了大约50%。在没有nginx的情况下，我可以在300秒内处理28K请求，但有了nginx，300秒内只能处理13k请求。服务器是虚拟机，所以不应该是网络问题，至少是物理问题。Nginx服务器没有高cpu负载，也没有任何资源限制。配置非常简单： user www-data; worker_processes auto; pid /run/nginx.pi

浏览 30提问于2017-03-07得票数 1

2回答

如何将文档索引到特定的ElasticSearch分片？

、

我希望将文档索引到特定的ElasticSearch分片。我知道我可以将ES配置为查看某个字段，然后根据该字段将其发送到特定的分片。我不想那样做。我只想说: 1)好的，我决定本周将所有文档导入到分片1，因为我想这样做。我知道有一种方法可以将查询发送到特定的分片，但是导入呢？我该怎么做呢？

浏览 2提问于2013-11-02得票数 1

1回答

Elasticsearch节点是否保留完整的索引副本？

、

我在Google上到处寻找，并没有真正能够找到这个问题的具体答案；假设我在Elasticsearch集群中有3个数据节点，那么默认情况下每个节点是否包含索引的整个副本？如果我的一个节点宕机，索引的一部分是否会丢失，或者碎片是否会重新分布在其余节点上，以便索引的整个副本始终可用？

浏览 0提问于2013-06-30得票数 0

回答已采纳

1回答

假设我们有一个Elasticsearch查询，其中包含路由关键字apple、bear、peach。路由键apple和bear映射到分片1，peach映射到分片2，发送时会有两个单独的查询发送到分片1，还是会有一个合并查询发送到分片1，因为ES已经在内部做了优化？假设发送到分片1的查询匹配doc1和doc2。主分片会收到来自分片1的doc1、doc2，还是会因为发送单独的查询而收到doc1、doc2、doc1、doc2？如果是后者，ES会过滤掉重复的文档吗？我读了the ES docs about routing，但没有运气。

浏览 12提问于2020-10-27得票数 1

回答已采纳

1回答

mongodb分片后采集数量增加

、、

我不能理解为什么在分片mongodb之后集合数量会增加。我收集了2000万条记录，当我分片的时候，收集的记录不断增加，请帮我解决这个问题集群配置 3个分片3个配置服务器6个查询路由器

浏览 0提问于2016-04-08得票数 1

2回答

两台elasticsearch服务器之间的负载均衡

、

我有两个ElasticSearch服务器： http://12.13.54.333:9200 和 http://65.98.54.10:9200 在第一个服务器中，我有100k的数据(id=1到id= 100k )，在第二个服务器中，我有100k的数据(id=100k+1到200k)。我想在两台服务器上的一个请求中对关键字obama进行文本搜索。这个是可能的吗？

浏览 1提问于2013-05-25得票数 1

回答已采纳

1回答

为什么大型DB通常实现为充满副本的分片，而不是充满分片的副本？

、、

我在互联网上搜索了有关复制和分片的信息，发现当两者一起使用时，它们几乎总是会考虑以下情况：接收来自应用服务器的查询。某种类型的路由软件路由到分片。该分片根据查询查询适当的副本并返回结果。我很好奇这个场景是否曾经实现过：接收来自应用服务器的查询。路由软件(如mongoDB中的mongo-S )从几个副本中选择一个。在该副本中是不同数据库表的碎片。它选择一个合适的值并返回结果。

浏览 0提问于2018-12-07得票数 0

9回答

Elasticsearch中的分片和副本

、

我试图理解Elasticsearch中的分片和副本是什么，但我没有设法理解它。如果我下载Elasticsearch并运行脚本，那么据我所知，我已经启动了一个只有一个节点的集群。现在这个节点(我的PC)有5个分片(?)和一些副本(?)。它们是什么，我有5个重复的索引吗？如果是这样，为什么？我可能需要一些解释。

浏览 1提问于2013-03-29得票数 399

回答已采纳

3回答

Rabbitmq队列分片

、

我必须实现这个场景：向rabbitmq发送外部应用程序发布消息。此消息具有client_id属性。我们可以将这个id放在路由键、消息头或其他一些属性中。我必须在交换路由逻辑中实现分片--消息应该根据client_id范围发送到特定的队列。是否有可能在标准的交换中实现？如果不是，我应该使用什么兑换作为基础？如何动态更改client_id范围？

浏览 3提问于2012-09-12得票数 1

2回答

Elasticsearch按节点搜索快照

elasticsearch快照默认为索引单位。但是，我希望在每个节点的基础上使用快照。例如，如果myIndex存在于三个节点上，我只想将节点1的myIndex保存为快照并恢复它。有可能吗？

浏览 33提问于2019-01-07得票数 0

1回答

分片在elasticsearch中的工作原理

我的索引中有"2“"number_of_shards”和"0“"number_of_replicas”。那么，如果我有3个节点，那么这2个分片如何分布在3个节点上呢? cluster.How分片在elasticsearch中起作用。

浏览 1提问于2014-08-01得票数 0

3回答

DynamoDB streams如何将记录分发到分片？

、、、

我的目标是确保以“正确”的顺序处理DynamoDB流发布的记录。我的表包含针对客户的事件。哈希键为事件ID，范围键为时间戳。“正确”的订单意味着相同客户ID的事件是按顺序处理的。可以并行处理不同的客户in。我通过Lambda函数使用流。每个分片都会自动生成消费者。因此，如果运行时决定对流进行分片，消耗将并行发生(如果我没弄错的话)，并且我冒着在处理CustomerAddressChanged事件之前处理CustomerCreated事件的风险(例如)。暗示没有任何方法可以影响分片。但他们并没有明确地这么说。有没有办法，例如，对范围键使用客户ID和时间戳的组合？

浏览 3提问于2017-05-30得票数 16

回答已采纳

1回答

对不带分表键的所有分片集合的MongoDB查询

、、

我有几个分片收集。集合是用户请求。分片键为用户Id。我有一个名为"Execution Time“的字段，我想查询一段时间(lte和gte)内的所有请求。索引有分片键，但我的查询没有分片键。我不想把所有的分片键都放在带有" in“操作符的查询中，因为我有1000个分片键(用户)。此外，我还需要获取每个查询的所有用户i这意味着每次查询2次，而不是1次。但是我仍然想使用索引..将userId >0< maxUserId添加到查询的选项是什么？什么是正确的方法？提前感谢

浏览 1提问于2014-05-21得票数 0

1回答

我不能仅通过全局标识符来判断行位于哪个DB中

、、、、

如果我有一个User表(以全局id作为主键)，该表基于username被分成10个数据库(DB1-DB10)，而另一个表试图使用User表行的全局id来引用User表，那么我就无法知道该用户位于哪个DB (1-10)中。这个问题的解决方案是什么？

浏览 1提问于2011-07-21得票数 0

2回答

多个分片键对mongodb的性能有帮助吗？

、

由于分片数据库使用分片键来拆分分块和路由查询，因此我认为更多分片键可能有助于使更多查询具有针对性我尝试像这样指定多个键 db.runCommand( { shardcollection : "test.users" , key : {_id:1, email : 1 ,address:1} 但我不知道它是否有效，以及这样做的缺点是什么。

浏览 1提问于2011-04-13得票数 4

回答已采纳

1回答

为什么elasticsearch仍然使用模数的简单路由值？

、、

我只是想知道为什么elasticsearch仍然使用简单的路由值方法来决定数据必须存储到哪个分片。实际上，这种方法限制了我们将来更改分片的数量。如果elasticsearch使用一致散列(甚至更好的技术)这样的方法，它可以让我们有机会在未来更改分片编号。有人对此有什么解释或想法吗？

浏览 18提问于2017-09-15得票数 1

1回答

如何在MongoDB共享集群中分发GridFS fs.chunks

、

我有一个包含10个分片的MongoDB分片/复制集群。大约十天前，我对这个集群进行了批量接收，它在GridFS中有相当多的数据。根据documentation，我在{ files_id : 1, n : 1 }上创建了一个分片索引。如下图所示，分片中的数据分布非常不均匀。平衡器已启用，但它仍然是这样的。(这只是db.fs.chunks.getShardDistribution()输出的图表。) 我如何强制它重新平衡？是否要移除分片s9？我做manually split chunks了吗？我在sh.status(true)中没有看到任何“巨型”分片。另外，如何使用文档中列出的索引来防止将来

浏览 12提问于2020-04-21得票数 0

1回答

MongoDB使主分片(不要与副本集的主分片混淆)仅保存未分片的集合

、

我有三台电脑(A，B，C)。在所有计算机上都会有主分片的副本集(以具有未分片集合的冗余)。在计算机B和C上，将有一个单一成员碎片副本集。如何告知mongodb不要在主分片副本集集群上持有任何分片的集合？

浏览 4提问于2021-03-03得票数 0

2回答

弹性搜索:连接被拒绝

直到3天前，我的弹性搜索(本地安装)还工作得很好。今天，由于连接错误，它停止工作。 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9200): Max retries exceeded with url: 我也尝试了以下选项。 curl -XGET http://127.0.0.1:9200 curl: (7) Failed to connect to 127.0.0.1 port 9200: Connection refused 我尝试使用下面的代码手动运行它，并

浏览 52提问于2017-01-30得票数 2

1回答

Elasticsearch显示logstash索引的运行状况为黄色

、、

The health column is showing yellow for logstash index , even after deleting old ones they re recreated with yellow health. I have clusters for this setup and have checked shards using below. GET _cluster/health : { "cluster_name" : "elasticsearch", "status" : "yell

浏览 67提问于2021-07-16得票数 0

1回答

数据仅进入一个副本集中

、、、

我有三个副本集，正在尝试进行分片。即使我在一个集合中添加了500000个文档，数据也只包含在一个分片中吗？这是我第一次尝试创建分片。我还在集合abcd和mybook上发布了getShardDistribution的输出 is集合在数据库shardingFinalDemo中，mybook在book中。对于每个集合，它会生成整个数据集的一个块这是sh.status()的输出 sharding version: { "_id" : 1, "minCompatibleVersion" : 5, "currentVersion&

浏览 2提问于2020-04-15得票数 0

4回答

mongos和mongos的确切区别是什么？

当我查看MongoDB文档时，我发现了两个不同的术语mongod和mongos。在启动服务器时，我使用./mongod --dbpath <path to mongodb>并运行./mongo来连接到服务器。有人能澄清一下这两个术语之间的区别吗？

浏览 4提问于2015-02-06得票数 37

1回答

Elasticsearch维护了多少Lucene实例？

、

我知道Elasticsearch为每个索引创建了大量的分片，并且每个分片都是它自己的N索引。但是有多少真正的Lucene实例是由Elasticsearch启动和维护的呢？是否每个节点都有一个Lucene实例，这意味着该实例处理每个节点的N * number_of_indices Lucene索引？

浏览 12提问于2020-10-04得票数 2

1回答

在父子关系中，对于孙子，如果我给父作为路由，它会坐在超级父分片中吗？

、

我有父子实现，对于超级父级，我不会给出路由，而对于子级，我会给出超级父级id作为路由，所以它将位于相同的分片中。对于孙子，我会给它的父id作为路由(我不想给超级父作为路由)，我担心的是，孙子会通过找到它的父分片然后找到父分片而坐在超级父分片中吗？

浏览 4提问于2015-11-07得票数 0

1回答

Elasticsearch集群在重新分片时失败

、

我对集群elasticsearch有一个很大的问题。我有3个节点，其中一个节点已停止elasticsearch并且群集变为红色，我使用service elasticsearch restart重新启动了所有节点，现在所有节点都已连接并开始重新分片，但在主节点中大约两个小时后，Elasticsearch的一个进程使用了100%的cpu，并且在端口9200/9300上没有响应，所以每次重新启动群集时，群集fall...this都会重复，无论主节点我不知道该做什么，我很绝望，有人可以帮助我吗？更新集群配置为： cluster.name: es-cluster node.name: es-node1

浏览 9提问于2016-09-08得票数 0

1回答

在数据上载过程中，ElasticSearch群集的黄色状态与大型群集的绿色状态

我有上传数据到ElasticSearch的脚本，它可以很好地处理包含3个ES实例的ES集群。但是对两个实例的集群运行该脚本会使该集群进入黄色状态。删除索引会将它们恢复为绿色。发现如下：“黄色集群状态意味着所有索引的主分片都分配给集群中的节点，但至少有一个索引的副本分片没有分配。” 我该怎么解决这个问题呢？我应该通过集群大小切换来改进我的脚本吗？

浏览 19提问于2019-06-12得票数 0

回答已采纳

2回答

如何使用spring data elasticSearch映射连接类型

、

我将数据从ES2.4重新索引到5.6。 es 2.4中的数据有两种类型，这两种类型是父子关系。当将其重新索引到es 5.6时，该索引仅包含单个类型，通过使用连接类型来解析父子关系。上面的数据运行正常。映射示例如下所示，它包含一个连接类型： "mappings": { "doc": { "properties": { "my_join_field": { "eager_global_ordinals": true,

浏览 2提问于2018-11-06得票数 3

3回答

MongoDB如何同时进行分片和复制？

、、

对于扩展/故障转移，mongodb使用“副本集”，其中有一个主服务器和一个或多个辅助服务器。主节点用于写入。次要文件用于读取。这几乎就是SQL编程中使用的主从模式。如果主节点出现故障，次要节点群集中的次节点将取而代之。因此，水平扩展和故障转移的问题就得到了解决。然而，这似乎不是一个允许分片的解决方案。一个真正的分片只包含整个数据的一部分，那么如果副本集中的次要数据是分片，那么当它没有服务请求所需的所有数据时，它怎么有资格成为主要数据呢？难道我们不需要为每个分片设置一个副本集吗？这显然是一个初学者的问题，所以一个直观的或以其他方式说明这是如何完成的链接将是有帮助的。

浏览 1提问于2013-02-07得票数 9

回答已采纳

4回答

ElasticSearch + Cassandra的实用限制

、、

我计划使用ElasticSearch来索引我的Cassandra数据库。我想知道是否有人看到过ElasticSearch的实际限制。在Do的范围内，事情会变慢吗？另外，有没有人在使用ElasticSearch为Cassandra建立索引时遇到任何问题？

浏览 1提问于2011-06-15得票数 24

回答已采纳

1回答

MemSQL中的分片键可以有NULL吗？

、

集群columnStore的分片key和key的规则是什么？我需要创建一个列作为分片键，还需要为集群columnStore创建一个列，但它可能包含Nulls 将可空的列保留为分片键会有什么影响？我已经使用这一列测试了数据加载，在较高的级别上，第一批看起来一切正常，但它会在写入或读取行的过程中破坏任何东西吗？ CREATE TABLE test ( name varchar(25) DEFAULT NULL, ID int(11) DEFAULT NULL, update_date date DEFAULT NULL, SHARD KEY (update_date) USING CLUST

浏览 29提问于2020-04-15得票数 0

2回答

mongodb分片-区块大小不同

、

我是使用mongodb的新手。由于我必须存储+-5000万个文档，所以我必须设置一个带有两个副本集的mongodb分片集群文档如下所示： { "_id" : "predefined_unique_id", "appNr" : "abcde", "modifiedDate" : ISODate("2016-09-16T13:00:57.000Z"), "size" : NumberLong(803), "crc32" : Num

浏览 1提问于2016-12-01得票数 3

2回答

Elasticsearch没有可用的磁盘空间

我有一个3节点的Elasticsearch集群，它耗尽了每个节点的磁盘空间。每个节点都是一个EC2实例。群集现在完全没有响应。我有什么解决方案来释放空间？在群集中添加节点是否会释放另一个节点中的空间，因为现在群集将在其他节点上重新分发信息？或者，我唯一的解决方案是创建一个更大的集群，然后迁移第一个集群中的数据，但肯定不是首选的解决方案？任何其他想法/解决方案都非常受欢迎。每个节点(elasticsearch.yml)上的群集配置如下所示： cluster.name: AutoSearchCluster node.name: i-asd4352 plugin.mandatory: cl

浏览 0提问于2015-11-01得票数 2

1回答

分片键如何选择？

、

我是NoSQL数据库的新手，现在我使用MongoDB，顺便说一下，我有一个关于MongoDB分片密钥的问题，我想知道它到底是做什么的？它是否与查询性能相关？我们如何为集合选择一个好的分片密钥？提前感谢

浏览 0提问于2012-07-07得票数 1

回答已采纳

1回答

MongoDB:共享集合中的$in运算符

、、

在分片集合的情况下，$in运算符是如何工作的？如果$in包含大量要搜索的ObjectId，find查询的性能会如何？

浏览 14提问于2020-09-01得票数 0

1回答

即使有0个未分配的分片，Elasticsearch集群状态仍为黄色

我们有一种情况，未分配的分片为0，但Elasticsearch集群状态仍为黄色。另一方面，一些索引数据正在被复制。我们看到相同的数据被输入了超过3到4次。下面是群集的当前状态 { "cluster_name": "elasticsearch", "status": "yellow", "timed_out": false, "number_of_nodes": 5, "number_of_data_nodes": 2, "active_primary_

浏览 0提问于2019-11-22得票数 1

1回答

如何重新平衡分片elasticsearch

我的集群中存储的数据不平衡。我如何重新平衡它？

浏览 2提问于2014-08-05得票数 4

2回答

elasticsearch集群绿色，只有一个节点

我有一个elasticsearch集群，它只报告它是绿色的，但只报告一个节点。根据我的研究，集群应该是黄色的，并且应该有两个独立的集群。那么，谁能解释一下为什么下面的集群报告为绿色状态？ { "cluster_name" : "elasticsearch", "status" : "green", "timed_out" : false, "number_of_nodes" : 1, "number_of_data_nodes" : 1, "acti

浏览 108提问于2019-09-18得票数 0

2回答

elasticsearch节点是否会在恢复后同步数据？

、、、、

假设我有一个包含5个Elasticsearch节点的集群，其中有一些数据。现在由于某种原因，其中一个节点崩溃了。在恢复之后，数据会丢失(创建了一个新卷)。我的问题是-为了获取现有数据，恢复的Elasticsearch节点是否会与集群同步？

浏览 40提问于2020-09-24得票数 0

回答已采纳

2回答

如何在现有索引上建立弹性搜索路由？

、、

我有一个索引，它使用elasticsearch的默认路由。现在我想建立自己的路由，我如何实现这一点？中的示例是： $ curl -XPUT 'http://localhost:9200/store/order/_mapping' -d ' { "order":{ "_routing":{ "required":true, "path":"customerID" } } } 这样做后，我是否需要重新索引，甚至重建整个索引

浏览 5提问于2015-12-09得票数 0

回答已采纳

1回答

TCP报头是否会出现在IP分段数据包中

、

在路由器中禁用ICMP时会发生什么情况?当数据包大小大于MTU时，路由器如何对数据包进行分段? TCP报头是否会出现在IP分段数据包中？

浏览 2提问于2013-07-26得票数 3

1回答

具有两个节点(不同的机器)的ElasticSearch未分配的分片，1个主控两个新实例

我启动了两个干净的elasticsearch实例(节点)，没有数据，两个不同的机器(一个windows，一个osx)。他们成功地发现了彼此。一个是node.master: false。两者都是node.data: true。我启动了Kibana (创建测试索引)，并创建了一个测试索引( .kibana ) number_of_replicas=1，每个索引的状态和集群都是黄色的，我认为这是因为未分配的分片。我不知道如何让未分配的分片来解决。在尝试强制复制分片时，我得到以下错误： shard cannot be allocated on same node [tNUHIE6cTHO6h37P_

浏览 0提问于2016-01-06得票数 2

1回答

如果我的索引进一步增长，有没有办法自动对索引进行分区

、

在Elasticsearch中，我的索引大小增长很快，因此延迟了复制。有没有办法在elasticsearch中自动划分索引。我知道一种以编程方式使用别名共享创建新索引的方法。想知道是否可以在管理员级别处理相同的问题。对于ex： index_main已经增长到复制导致问题的程度，我需要自动创建动态索引，比如index_022019、index_032019等。

浏览 2提问于2019-03-26得票数 0

2回答

Elasticsearch :建议创建的索引数量是多少？

在elasticsearch中可以创建的索引的建议数量是多少？对此有什么标准公式吗？我试着创建近似的。300个索引，每个索引大约有50个文档。但它正在失败。

浏览 1提问于2018-06-13得票数 0

1回答

C# MongoDB驱动程序故障(规范)

、、

我在生产中使用了NORM driver。新年假期-这很酷，所以我的项目负载很高，我想设置一个复制集，但有一个问题- Norm不支持复制集:(。据我所知，分片也是这样吗？帮助我:)谁使用了mongodb csharp或官方的10gen驱动程序和replset？在生产上有什么问题吗？如果我选择另一个驱动程序，我将不得不重写存储库，但我不希望它是徒劳的。有什么问题吗？

浏览 0提问于2010-12-20得票数 1

1回答