元数据加速桶生命周期

最近更新时间:2024-09-19 17:38:11

我的收藏
COS 元数据加速桶兼容 COS 生命周期能力,适用于数据数仓数据冷热分层等场景。元数据加速桶支持使用 COS 控制台及 API 配置生命周期规则,具体使用方法可参考:COS 生命周期概述

与 COS 生命周期的差异

COS 元数据加速桶与 COS 桶生命周期有如下差异,在使用时请您关注:
1. 规格限制:COS 元数据加速桶限制单个存储桶下生命周期规则数量最多1000条,若有特殊场景需要提升此限制,请 联系我们
2. 更新时间:元数据加速桶生命周期使用最近文件更新时间作为沉降或删除的依据。COS 元数据加速后端文件 MTime、ATime、CTime 中的最近时间,作为文件更新时间。暂不支持指定特定时间(MTime、ATime、CTime)作为沉降依据。例如,若您6月1日创建文件text.txt,6月10日再次访问该文件,后续对此文件无操作。6月11日配置生命周期规则,指定text.txt更新后10天沉降至低频。此时生命周期扫描判断,该文件的 MTime 为6月1日;ATime 为6月10日,该文件的最近更新时间为6月10日,该文件将会于6月20日沉降为低频存储类型。
说明:
为保证读写性能最优,COS 元数据加速默认不开启 ATime 追踪。若您需要使用 ATime 功能,请 联系我们
为避免生命周期早于配置时间提前执行,使用生命周期沉降或删除文件(例如 .Trash)前,请您参考 回收站清空机制说明
3. 文件前缀:元数据加速桶生命周期支持前缀筛选功能仅支持填写为目录,暂不支持 前缀排除 功能。配置前缀时无需在路径前后携带 /,COS 后端会默认将该路径作为目录处理。另外,因为前缀仅支持目录,因此暂不支持普通 COS 桶中的路径通配功能。例如,您的桶中有如下两个路径:
user/hive/warehouse/test.db/test_table/
user/hive/warehouse/test.db/test_table2/
若您在生命周期规则中配置文件前缀为 user/hive/warehouse/test.db/test_table,将该路径作为目录匹配,仅会命中第一个路径,不会对 test_table2生效。
4. 当前元数据加速桶支持按以下顺序单向沉降文件:
单 AZ 元数据加速桶:标准存储 > 低频存储 > 归档存储 > 深度归档存储
多 AZ 元数据加速桶:多 AZ 标准存储 > 多 AZ 低频存储

使用方式

当前元数据加速桶支持使用 COS 控制台和 S3 Lifecycle API 配置生命周期规则。

通过控制台配置

使用控制台配置的流程如下:

通过 API 配置

元数据加速桶复用 COS 生命周期能力,支持使用 COS Lifecycle 接口开启清单配置。由于元数据加速桶特性,API 中部分字段与 COS 接口存在差异,具体调用方式请参照如下接口示例: