首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >索引分片删除数占比过高

索引分片删除数占比过高

原创
作者头像
ES小助理
发布2022-11-28 17:51:25
5690
发布2022-11-28 17:51:25
举报
文章被收录于专栏:ES排障ES排障

问题现象

分片deleted文档数占比过高,代表此索引分片存在频繁的数据更新,此类业务场景理论上不是ES最擅长的。数据更新代表着每次操作都设计搜索、标记删除、新增,更新速度过快时容易给集群带来较大压力。

而且根据以往运营经验,还发现ES在处理deleted占比量较大的分片时,可能会存在merge性能差等现象,造成集群单线程单CPU高负载,影响整体性能。

问题解析

我们过_cat/indices?v 可以查看到docs.deleted数量,如果docs.deleted数量占比索引总文档数过多,可确定会存在问题。当前运营经验按照30%来进行衡量。

解决方案

1-通过定期forcemerge彻底删除标记删除的文档。

参考:https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-forcemerge.html

POST index/_forcemerge?only_expunge_deletes=true&max_num_segments={参
数}

2-减少ES更新类业务

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 问题现象
  • 问题解析
  • 解决方案
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档