开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在Elasticsearch的生产部署中，将现场数据转换为true是一种好的做法吗？

在Elasticsearch的生产部署中，将现场数据转换为true不是一种好的做法。

Elasticsearch是一个开源的分布式搜索和分析引擎，用于处理大规模数据的搜索、分析和存储。在生产部署中，现场数据（也称为"fielddata"）是指在索引中存储和处理文本字段的数据。将现场数据转换为true意味着将文本字段的内容加载到内存中，以便进行快速搜索和聚合操作。

然而，将现场数据转换为true存在以下问题：

内存消耗：现场数据加载到内存中会占用大量的内存资源，特别是对于大规模的数据集来说，可能会导致内存不足的问题。
性能影响：现场数据加载到内存中会增加搜索和聚合操作的速度，但同时也会增加CPU和内存的负载，可能导致性能下降。
索引大小增加：现场数据加载到内存中会增加索引的大小，占用更多的磁盘空间。

相反，推荐的做法是根据实际需求来选择是否将现场数据转换为true。如果需要频繁地进行搜索和聚合操作，并且有足够的内存资源来支持，可以考虑将现场数据转换为true。但在大多数情况下，建议使用其他优化技术来提高搜索和聚合的性能，例如使用倒排索引、合理设计数据模型、使用合适的查询语法等。

对于Elasticsearch的生产部署，腾讯云提供了Elasticsearch服务（https://cloud.tencent.com/product/es），可以帮助用户快速部署和管理Elasticsearch集群。该服务提供了高可用、高性能的Elasticsearch集群，支持自动扩缩容、数据备份和恢复等功能，适用于各种搜索和分析场景。

相关搜索:rxjs。将代码放在subscribe方法中是一种好的做法吗？在Django Rest框架中覆盖list()是一种好的做法吗？在Heroku上部署后，在生产环境中自动运行php artisan migrate是一种好的做法吗？在JavaScript中检查对象属性的存在!obj[key]是一种好的做法吗？在jQuery中重定向到新页面是一种好的做法吗在MVVM的适配器中启动intent是一种好的做法吗？在python中手动退出线程是一种好的做法吗？在ReactJS中使用onClick中的return是一种好的做法吗？在redux store中添加CSRF令牌是一种好的做法吗？在Redux存储中设置配置是一种好的做法吗？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

华为开发者大会HDC.Cloud技术探秘：云搜索服务技术实践

搜索是一个古老的技术，从互联网发展的第一天开始，搜索技术就绽放出了惊人的社会和经济价值。随着信息社会快速发展，数据呈爆炸式增长，搜索技术通过数据收集与处理，满足信息共享与快速检索的需求。基于搜索技术，更是缔造了谷歌、百度、雅虎等一批知名企业。

02

Elasticsearch遇上BERT：使用Elasticsearch和BERT构建搜索引擎

在这篇文章中，我们使用一个预先训练好的BERT模型和Elasticsearch来构建一个搜索引擎。Elasticsearch最近发布了带有矢量字段的文本相似性搜索。另一方面，你可以使用BERT将文本转换为固定长度的向量。一旦我们通过BERT将文档转换成向量并存储到Elasticsearch中，我们就可以使用Elasticsearch和BERT搜索类似的文档。

02

07 Confluent_Kafka权威指南第七章：构建数据管道

当人们讨论使用apache kafka构建数据管道时，他们通常会应用如下几个示例，第一个就是构建一个数据管道，Apache Kafka是其中的终点。丽日，从kafka获取数据到s3或者从Mongodb获取数据到kafka。第二个用例涉及在两个不同的系统之间构建管道。但是使用kafka做为中介。一个例子就是先从twitter使用kafka发送数据到Elasticsearch，从twitter获取数据到kafka。然后从kafka写入到Elasticsearch。我们在0.9版本之后在Apache kafka 中增加了kafka connect。是我们看到之后再linkerdin和其他大型公司都使用了kafka。我们注意到，在将kafka集成到数据管道中的时候，每个公司都必须解决的一些特定的挑战，因此我们决定向kafka 添加AP来解决其中的一些特定的挑战。而不是每个公司都需要从头开发。 kafka为数据管道提供的主要价值是它能够在管道的各个阶段之间充当一个非常大的，可靠的缓冲区，有效地解耦管道内数据的生产者和消费者。这种解耦，结合可靠性、安全性和效率，使kafka很适合大多数数据管道。

03

开源数据同步神器——canal

如今大型的IT系统中，都会使用分布式的方式，同时会有非常多的中间件，如redis、消息队列、大数据存储等，但是实际核心的数据存储依然是存储在数据库，作为使用最广泛的数据库，如何将mysql的数据与中间件的数据进行同步，既能确保数据的一致性、及时性，也能做到代码无侵入的方式呢？如果有这样的一个需求，数据修改后，需要及时的将mysql中的数据更新到elasticsearch,我们会怎么进行实现呢？

01

Elasticsearch 预处理没有奇技淫巧，请先用好这一招！

es可以根据_id字符串切分，再聚合统计吗比如：数据1、_id=C12345 数据2、_id=C12456 数据3、_id=C31268

01

Elasticsearch 常见的 8 种错误及最佳实践

Elasticsearch 社区有大量关于 Elasticsearch 错误和异常的问题。

03

【Elasticsearch系列之一】ES基本概念

ES 是一个近实时的搜索平台，当一个文档写入Lucene后是不能被立即查询到的。Elasticsearch提供了一个refresh操作，会定时地调用lucene的reopen(新版本为openIfChanged)为内存中新写入的数据生成一个新的segment，此时被处理的文档均可以被检索到。refresh操作的时间间隔由refresh_interval参数控制，默认为1s, 可以在写入请求中带上refresh表示写入后立即refresh，另外还可以调用refresh API显式refresh，例如：

【干货】Elasticsearch的索引性能优化（3）

本文是Elasticsearch索引优化系列的第三篇，此前已发布第一篇和第二篇。本系列教程主要目的是通过对Elasticsearch配置进行调优来提升索引性能，并降低监控和管理压力。本文翻译自QBox官方博客，版权归原作者Adam Vanderbush所有。

02

【干货】Elasticsearch的索引性能优化（3）

本文是Elasticsearch索引优化系列的第三篇，此前已发布第一篇和第二篇。本系列教程主要目的是通过对Elasticsearch配置进行调优来提升索引性能，并降低监控和管理压力。本文翻译自QBox官方博客，版权归原作者Adam Vanderbush所有。

03

【全文检索_09】Logstash 基本介绍

ELK 是 Logstash(收集)、Elasticsearch(存储 + 搜索)、Kibana(展示)，这三者的简称，以前称为 ELK Stack，现在称为 Elastic Stack，后来还加入了 Beats 来优化 Logstash。我们之前介绍了 Elasticsearch 和 Kibana 的简单使用，现在重点介绍一下 Logstash。 Logstash 是一个开源数据收集引擎，具有实时管道功能。Logstash 可以动态地将来自不同数据源的数据统一起来，并将数据标准化到你所选择的目的地。Logstash 使用 JRuby 开发，Ruby 语法兼容良好，非常简洁强大，经常与 ElasticSearch，Kibana 配置，组成著名的 ELK 技术栈，非常适合用来做日志数据的分析。当然 Logstash 也可以单独出现，作为日志收集软件，可以收集日志到多种存储系统或临时中转系统，如 MySQL，redis，kakfa，HDFS, lucene，solr 等，并不一定是 ElasticSearch。

02

Docker 入门到实战教程(十二)ELK+Filebeat搭建日志分析系统

一般我们需要进行日志分析场景：直接在日志文件中 grep、awk 就可以获得自己想要的信息。但在规模较大的场景中，此方法效率低下，面临问题包括日志量太大如何归档、文本搜索太慢怎么办、如何多维度查询。需要集中化的日志管理，所有服务器上的日志收集汇总。常见解决思路是建立集中式日志收集系统，将所有节点上的日志统一收集，管理，访问。

02

如何在Ubuntu 14.04上设置生产Elasticsearch集群

Elasticsearch是一种流行的开源搜索服务器，用于实时分布式搜索和数据分析。当用于开发以外的任何其他任务时，Elasticsearch应作为集群跨多个服务器部署，以获得最佳性能，稳定性和可伸缩性。

01

Logstash中如何处理到ElasticSearch的数据映射

Logstash作为一个数据处理管道，提供了丰富的插件，能够从不同数据源获取用户数据，进行处理后发送给各种各样的后台。这中间，最关键的就是要对数据的类型就行定义或映射。

02

超有趣！上周六的 es 深圳 Meetup 发生了什么事儿？

2019 年 4 月 20 日，由 Elastic 中文社区、vivo 互联网、腾讯云+社区联合主办的“Elastic 深圳 Meetup” 在深圳腾讯大厦 2F 多功能厅如期举行。

05

如何在CentOS 7上设置生产Elasticsearch集群

Elasticsearch是一种流行的开源搜索服务器，用于实时分布式搜索和数据分析。当用于开发以外的任何其他任务时，Elasticsearch应作为集群跨多个服务器部署，以获得最佳性能，稳定性和可伸缩性。

00

探究 | Elasticsearch集群规模和容量规划的底层逻辑

问题 1：请问下大家是如何评估集群的规模？比如数据量达到百万，千万，亿万，分别需要什么级别的集群，这要怎么评估？

03

Flink 实践教程：入门（2）：写入 Elasticsearch

作者：腾讯云流计算 Oceanus 团队流计算 Oceanus 简介流计算 Oceanus 是大数据产品生态体系的实时化分析利器，是基于 Apache Flink 构建的具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点的企业级实时大数据分析平台。流计算 Oceanus 以实现企业数据价值最大化为目标，加速企业实时化数字化的建设进程。本文将为您详细介绍如何使用 datagen 连接器生成随机数据，经过流计算 Oceanus，最终将计算数据存入 Elasticsearch 。前置准备创建

02

初识 Elasticsearch7.x（一）

Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域，Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。

05

Beats：Beats 入门教程（一）

在今天的这个教程里，我们来针对初学者如何快速地了解 Beats 是什么，并如何快速地部署 Beats。如果你想了解更多关于 Beats 方面的知识，可以参阅我的文章。

06

基于Kafka+ELK搭建海量日志平台

早在传统的单体应用时代，查看日志大都通过SSH客户端登服务器去看，使用较多的命令就是 less 或者 tail。如果服务部署了好几台，就要分别登录到这几台机器上看，等到了分布式和微服务架构流行时代，一个从APP或H5发起的请求除了需要登陆服务器去排查日志，往往还会经过MQ和RPC调用远程到了别的主机继续处理，开发人员定位问题可能还需要根据TraceID或者业务唯一主键去跟踪服务的链路日志，基于传统SSH方式登陆主机查看日志的方式就像图中排查线路的工人一样困难，线上服务器几十上百之多，出了问题难以快速响应，因此需要高效、实时的日志存储和检索平台，ELK就提供这样一套解决方案。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭