我们需要遍历我们的AWS ElasticSearch集群6.0版中的所有文档,并收集所有重复用户ids的计数。我曾尝试使用Data Visualization来聚合用户is的计数并导出它们,但这些数字与我们的另一个可通过传统SQL搜索的数据源不匹配。我们希望看到的是这样的: USER ID COUNT userid1 4 userid22 3...我不是一个高级的Lucene查询人
我有数以百万计的文件,像这样的块: "useraccountid": 123456, "last_updated" : "Sat Apruseraccountid, max(purchases_history.purchases.purchase_date) FROM my_index GROUP BY useraccountid
我只找到了最大聚合,但它聚集在索引中<