首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Elasticsearch的生产部署中,将现场数据转换为true是一种好的做法吗?

在Elasticsearch的生产部署中,将现场数据转换为true不是一种好的做法。

Elasticsearch是一个开源的分布式搜索和分析引擎,用于处理大规模数据的搜索、分析和存储。在生产部署中,现场数据(也称为"fielddata")是指在索引中存储和处理文本字段的数据。将现场数据转换为true意味着将文本字段的内容加载到内存中,以便进行快速搜索和聚合操作。

然而,将现场数据转换为true存在以下问题:

  1. 内存消耗:现场数据加载到内存中会占用大量的内存资源,特别是对于大规模的数据集来说,可能会导致内存不足的问题。
  2. 性能影响:现场数据加载到内存中会增加搜索和聚合操作的速度,但同时也会增加CPU和内存的负载,可能导致性能下降。
  3. 索引大小增加:现场数据加载到内存中会增加索引的大小,占用更多的磁盘空间。

相反,推荐的做法是根据实际需求来选择是否将现场数据转换为true。如果需要频繁地进行搜索和聚合操作,并且有足够的内存资源来支持,可以考虑将现场数据转换为true。但在大多数情况下,建议使用其他优化技术来提高搜索和聚合的性能,例如使用倒排索引、合理设计数据模型、使用合适的查询语法等。

对于Elasticsearch的生产部署,腾讯云提供了Elasticsearch服务(https://cloud.tencent.com/product/es),可以帮助用户快速部署和管理Elasticsearch集群。该服务提供了高可用、高性能的Elasticsearch集群,支持自动扩缩容、数据备份和恢复等功能,适用于各种搜索和分析场景。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

07 Confluent_Kafka权威指南 第七章: 构建数据管道

当人们讨论使用apache kafka构建数据管道时,他们通常会应用如下几个示例,第一个就是构建一个数据管道,Apache Kafka是其中的终点。丽日,从kafka获取数据到s3或者从Mongodb获取数据到kafka。第二个用例涉及在两个不同的系统之间构建管道。但是使用kafka做为中介。一个例子就是先从twitter使用kafka发送数据到Elasticsearch,从twitter获取数据到kafka。然后从kafka写入到Elasticsearch。 我们在0.9版本之后在Apache kafka 中增加了kafka connect。是我们看到之后再linkerdin和其他大型公司都使用了kafka。我们注意到,在将kafka集成到数据管道中的时候,每个公司都必须解决的一些特定的挑战,因此我们决定向kafka 添加AP来解决其中的一些特定的挑战。而不是每个公司都需要从头开发。 kafka为数据管道提供的主要价值是它能够在管道的各个阶段之间充当一个非常大的,可靠的缓冲区,有效地解耦管道内数据的生产者和消费者。这种解耦,结合可靠性、安全性和效率,使kafka很适合大多数数据管道。

03

【全文检索_09】Logstash 基本介绍

ELK 是 Logstash(收集)、Elasticsearch(存储 + 搜索)、Kibana(展示),这三者的简称,以前称为 ELK Stack,现在称为 Elastic Stack,后来还加入了 Beats 来优化 Logstash。我们之前介绍了 Elasticsearch 和 Kibana 的简单使用,现在重点介绍一下 Logstash。   Logstash 是一个开源数据收集引擎,具有实时管道功能。Logstash 可以动态地将来自不同数据源的数据统一起来,并将数据标准化到你所选择的目的地。Logstash 使用 JRuby 开发,Ruby 语法兼容良好,非常简洁强大,经常与 ElasticSearch,Kibana 配置,组成著名的 ELK 技术栈,非常适合用来做日志数据的分析。当然 Logstash 也可以单独出现,作为日志收集软件,可以收集日志到多种存储系统或临时中转系统,如 MySQL,redis,kakfa,HDFS, lucene,solr 等,并不一定是 ElasticSearch。

02

基于Kafka+ELK搭建海量日志平台

早在传统的单体应用时代,查看日志大都通过SSH客户端登服务器去看,使用较多的命令就是 less 或者 tail。如果服务部署了好几台,就要分别登录到这几台机器上看,等到了分布式和微服务架构流行时代,一个从APP或H5发起的请求除了需要登陆服务器去排查日志,往往还会经过MQ和RPC调用远程到了别的主机继续处理,开发人员定位问题可能还需要根据TraceID或者业务唯一主键去跟踪服务的链路日志,基于传统SSH方式登陆主机查看日志的方式就像图中排查线路的工人一样困难,线上服务器几十上百之多,出了问题难以快速响应,因此需要高效、实时的日志存储和检索平台,ELK就提供这样一套解决方案。

03
领券