前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Elasticsearch ILM实现索引全生命周期自动管理,解放双手

Elasticsearch ILM实现索引全生命周期自动管理,解放双手

作者头像
MCNU云原生
发布2023-03-17 10:00:55
6210
发布2023-03-17 10:00:55
举报
文章被收录于专栏:MCNU云原生MCNU云原生
一、什么是Elasticsearch ILM?

Elasticsearch Index Lifecycle Management(ILM)是Elasticsearch的一个功能,用于管理索引的生命周期,优化索引的性能和减少存储成本。ILM可以自动执行索引的各种操作,如创建、删除、滚动、缩小等,从而帮助用户轻松地管理索引的生命周期。ILM可以帮助用户减少手动干预的工作量,使其可以更好地专注于数据分析。

ILM机制通过在索引生命周期的不同阶段执行动作来实现自动化管理。以下是ILM机制的四个阶段及其对应的动作:

  1. 热阶段(Hot Phase):此阶段索引处于活动状态,数据频繁更新和查询。在这个阶段,可以配置滚动索引,将较旧的数据移动到暖阶段或冷阶段。此外,可以设置索引别名,使所有查询都指向新索引。
  2. 暖阶段(Warm Phase):此阶段索引处于半活动状态,数据较少更新和查询。在这个阶段,可以执行一些操作,如压缩索引、合并段或更改数据存储方式,以减少存储成本。
  3. 冷阶段(Cold Phase):此阶段索引处于非活动状态,数据不再更新,只有少量查询。在这个阶段,可以将索引移动到低成本的存储层(如S3),以进一步减少存储成本。
  4. 删除阶段(Delete Phase):此阶段索引被删除,释放存储空间。

二、ILM的所有用法

数据从Hot到Warm再到Cold,最后被Delete,这对应着我们日常的业务数据应用情况,随着时间的推移,数据的重要性越来越低,我们常常更关注近期的数据,而所有的数据存储在Elasticsearch都极大占用系统资源,ILM这个功能极为重要,让系统资源控制和集群性能优化尽量自动化,减少人工维护的成本。

以下举个例子从整个生命周期来对索引进行管理:

2.1、创建一个新的索引并将其分配给别名

下面的代码创建一个名为“my_index”的新索引,并将其分配给别名“my_alias”。此外,这个代码使用ILM API定义了一个phases为“hot”的生命周期阶段,并为此阶段定义了最大文档空间大小和最大文档数,一旦超过就会执行索引滚动操作,创建新的索引,并通过别名指定。

代码语言:javascript
复制
PUT _ilm/policy/hot_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "50GB",
            "max_docs": 100000000
          }
        }
      }
    }
  }
}

PUT /my_index-000001
{
  "aliases": {
    "my_alias": {
      "is_write_index": true
    }
  },
  "settings": {
    "index.lifecycle.name": "hot_policy"
  }
}
2.2、将索引从“hot”阶段转移到“warm”阶段

如下定义了一个hot_warm_policy,定义了hot和warm两个生命周期阶段,超过7天的索引会执行warm阶段相关的操作,如actions所示,执行forcemerge和shrink操作,这能显著降低分片数量和segments数量,对于集群的性能有比较大的提升。

代码语言:javascript
复制
PUT _ilm/policy/hot_warm_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "50GB",
            "max_docs": 100000000
          }
        }
      },
      "warm": {
        "min_age": "7d",
        "actions": {
          "forcemerge": {},
          "shrink": {
            "number_of_shards": 1
          }
        }
      }
    }
  }
}

POST my_index-000001/_rollover
{
  "conditions": {
    "max_age":   "1d"
    }
}
2.3、将索引从“warm”阶段转移到“cold”阶段

同样的,下面的代码则在此基础上又增加了"cold"阶段,下面的代码演示了如何将索引从“warm”阶段转移到“cold”阶段,并在此阶段使用“freeze”操作来冻结索引,以便将其留在磁盘上,但不进行任何搜索操作,被freeze的索引,其元数据等信息将不会被缓存在内存中,能显著降低Elasticsearch堆内存的占用,降低集群压力。

代码语言:javascript
复制
PUT _ilm/policy/hot_warm_cold_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "50GB",
            "max_docs": 100000000
          }
        }
      },
      "warm": {
        "min_age": "7d",
        "actions": {
          "forcemerge": {},
          "shrink": {
            "number_of_shards": 1
          }
        }
      },
      "cold": {
        "min_age": "30d",
        "actions": {
          "freeze": {}
        }
      }
    }
  }
}

POST my_index-000001/_rollover
{
  "conditions": {
    "max_age": "7d"
  }
}
2.4、将索引从“cold”阶段转移到“delete”阶段

以下代码"delete"阶段,表示删除所有超过90天的索引。

代码语言:javascript
复制
PUT _ilm/policy/hot_warm_cold_delete_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "50GB",
            "max_docs": 100000000
          }
        }
      },
      "warm": {
        "min_age": "7d",
        "actions": {
          "forcemerge": {},
          "shrink": {
            "number_of_shards": 1
          }
        }
      },
      "cold": {
        "min_age": "30d",
        "actions": {
          "freeze": {}
        }
      },
      "delete": {
        "min_age": "90d",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

通过以上操作可以发现,Elasticsearch的ILM功能完全解放了管理员手工操作管理索引生命周期,极大释放了生产力,不仅效率提升,而且不会容器出现因为忘记操作删除历史数据等问题导致应用性能受损的情况。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MCNU云原生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 二、ILM的所有用法
    • 2.1、创建一个新的索引并将其分配给别名
      • 2.2、将索引从“hot”阶段转移到“warm”阶段
        • 2.3、将索引从“warm”阶段转移到“cold”阶段
          • 2.4、将索引从“cold”阶段转移到“delete”阶段
          相关产品与服务
          数据保险箱
          数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档