有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

概述

您可以通过 日志服务(Cloud Log Service,CLS)控制台,将数据按照分隔符格式投递到对象存储(Cloud Object Storage,COS),下面将为您详细介绍如何创建分隔符格式日志投递任务。

前提条件

1. 开通日志服务,创建日志集与日志主题,并成功采集到日志数据。
2. 开通腾讯云对象存储服务,并且在待投递日志主题的地域已创建存储桶,详细配置请参见 创建存储桶 文档。
3. 子账号/协作者需要主账号授权,授权步骤参考 基于 CAM 管理权限,复制授权策略参考 自定义权限策略示例
4. 已授权给腾讯云 CLS 服务角色访问 COS 的权限。大部分用户通过控制台操作时,系统会引导用户完成授权;小部分用户跨过控制台,直接调用 API,这部分客户需要手动去授权,详情参考 投递权限查看及配置

操作步骤

2. 在左侧导航栏中,单击日志主题
3. 单击需要投递的日志主题ID/名称,进入日志主题管理页面。
4. 单击投递至 COS 页签,进入投递至 COS 配置页面。
5. 参照下图,依次填写配置信息。


配置项说明如下:
配置项
解释说明
规则
是否必填
投递任务名称
配置投递任务的名称。
字母、数字、_和-
必填
COS 存储桶
与当前日志主题同地域的存储桶作为投递目标存储桶。
列表选择
必填
COS 路径
COS 存储桶的路径。默认按照/年/月/日/小时/如/2022/7/31/14/ 这种格式在 COS 上来存储投递的日志文件,这里支持 strftime 的语法 ,例如投递时间是 2022/7/31 14:00,/%Y/%m/%d/生成的路径是/2022/7/31/。/%Y%M%d/%H/生成的路径是/20220731/14/
/开头
可选
文件命名
选项1:投递时间命名,推荐这个选项,例如202208251645_000_132612782.gz代表的是投递时间_日志主题分区_offset,Hive 也可以加载这种文件。选项2:随机数命名,旧版的命名方式,这种命名方式 Hive 不识别,因为 Hive 不识别_开头的文件,可以在 COS 路径配置项里面添加自定义前缀,例如/%Y%M%d/%H/Yourname。
/
必填
压缩格式
为了帮助用户节约读流量费用,我们将日志文件压缩后再投递到 COS,支持 Snappy\\lzop\\gzip。
gzip\\snappy\\lzop
必填
投递文件大小
需要投递的原始日志文件的大小,和投递间隔时间配合使用,哪个条件先触发,就按照哪个规则去压缩文件,然后投递到 COS。例如配置256M,15分钟,如果文件大小在5分钟就到了256MB,那么文件大小这个条件先触发投递任务
5 - 256,单位:MB
必填
投递间隔时间
指定间隔多长时间,触发一次投递,和投递文件大小配合使用,哪个条件先触发,就按照哪个规则去压缩文件,然后投递到 COS。例如配置256MB,15分钟,如果文件大小在15分钟时仅为200MB,间隔时间这个条件先触发投递任务
300 - 900,单位:s
必填
6. 单击下一步,进入高级配置,选择投递格式为 CSV,并依次填写相关配置参数。


配置项说明如下:
配置项
解释说明
规则
是否必填
键值名称(key)
指定写入 CSV 文件的键值(key)字段(填写的 key 必须是日志结构化后的 key 名称或保留字段,否则将视为无效 key)。
字母、数字、_和-
必填
分隔符
CSV 文件中各字段间的分隔符。
列表选择
必填
转义符
若正常字段内出现了分隔符的字符,需用转义符包裹该字符,防止读取数据时被错误识别。
列表选择
必填
无效字段
若配置的键值字段(key)不存在时,则会用无效字段进行填充 。
列表选择
必填
首行 Key
在 CSV 文件的首行增加字段名的描述,即将键值(key)写入 CSV 文件的首行,默认不写入。
开/关
必填