CSV 格式投递

最近更新时间:2019-07-15 18:27:43

概述

您可以通过 日志服务控制台,将数据按照 CSV 格式投递到对象存储 COS,下面将为您详细介绍如何创建 CSV 格式日志投递任务。

前提条件

 1. 开通日志服务,创建日志集与日志主题,并成功采集到日志数据。
 2. 开通腾讯云对象存储服务(COS),并且在待投递日志主题的地域已创建存储桶,详细配置请参见 创建存储桶 文档。
 3. 确保当前操作账号拥有配置投递的权限,子账号/协作者投递权限问题请参见 子账号配置投递 文档。

操作步骤

 1. 登录 日志服务控制台
 2. 在左侧导航栏中,单击【日志集管理】。
 3. 单击需要设置投递任务的日志集 ID/名称,进入日志集详情页。
 4. 找到需要投递的日志主题,在其操作栏中,单击【管理配置】>【投递对象存储配置】,进入投递配置页面。
 5. 单击【添加投递配置】,进入投递至 COS 配置页面,依次填写配置信息。

  配置项说明如下:
配置项 解释说明 规则 是否必填
投递任务名称 配置投递任务的名称。 字母、数字、_和- 必填
COS存储桶 与当前日志主题同地域的存储桶作为投递目标存储桶 。 列表选择 必填
目录前缀 日志服务支持自定义目录前缀,日志文件会投递至对象存储 Bucket 的该目录下。目前默认是直接放在存储桶下,文件路径为{COS 存储桶}{目录前缀}{分区格式}_{random}_{index}.{type},其中{random}_{index}是一个随机数。 非/开头 可选
分区格式 将投递任务创建时间按照 strftime 的语法自动生成目录 ,其中斜线/表示一级 COS 目录。 strftime 格式 必填
投递文件大小 指定在该投递时间间隔中未压缩的投递文件上限,意味着在该时间间隔中,日志文件最大将为您设置的值,超过该上限,将被分成多个日志文件,上限支持100MB - 10000MB。 100 - 10000,单位:MB 必填
投递间隔时间 指定投递的时间间隔,支持60s - 3600s。假设您设置投递时间间隔为5分钟,那么意味着您的日志数据将每5分钟产生一个日志文件,每隔一段时间(半小时内),多个日志文件会一起投递至您的存储桶。 60 - 3600,单位:s 必填

上表中的分区格式请按照 strftime 格式 要求填写,不同的分区格式会影响投递到对象存储的文件路径。 以下举例说明分区格式的用法,例如投递至 bucket_test 存储桶,目录前缀为logset/,投递时间 2018/7/31 17:14,则对应的投递文件路径如下:

存储桶名称 目录前缀 分区格式 cos 文件路径
bucket_test logset/ %Y/%m/%d bucket_test:logset/2018/7/31_{random}_{index}
bucket_test logset/ %Y%m%d/%H bucket_test:logset/20180731/14_{random}_{index}
bucket_test logset/ %Y%m%d/log bucket_test:logset/20180731/log_{random}_{index}
 1. 单击【下一步】,进入高级配置,选择投递格式为 CSV,依次填写相关配置参数。
  img
  配置项说明如下:
配置项 解释说明 规则 是否必填
键值名称(key) 指定写入 CSV 文件的键值(key)字段(填写的 key 必须是日志结构化后的 key 名称或保留字段,否则将视为无效 key)。 字母、数字、_和- 必填
分隔符 CSV 文件中各字段间的分隔符。 列表选择 必填
转义符 若正常字段内出现了分隔符的字符,需用转义符包裹该字符,防止读取数据时被错误识别。 列表选择 必填
无效字段 若配置的键值字段(key)不存在时,则会用无效字段进行填充 。 列表选择 必填
首行 Key 在 CSV 文件的首行增加字段名的描述,即将键值(key)写入 CSV 文件的首行,默认不写入。 开/关 必填
压缩投递 是否对日志文件进行压缩后投递,在投递时的未压缩文件大小上限为10GB 。目前支持的压缩方式有 gzip 和 lzop。 开/关 必填

高级选项(可选)
日志投递还支持根据日志内容进行过滤投递的功能,您可以打开高级选项进行配置。

说明:

投递过滤规则最多支持5条,多条规则之间是“与”逻辑,即每条规则都满足的情况下才能投递成功。

a. 您需要先指定一个 key,通过设置过滤规则对其进行正则提取过滤。
b. 用“()”捕获需要和 value 进行匹配的对象,并在 value 处填上所要匹配的值。系统会先根据投递规则中的正则表达式进行一次匹配,提取出捕获组“()”的内容,并和 value 值进行比较,当捕获出来的内容=value 时,则该条日志数据将会投递。
示例1:
指定字段名为 status,该键值对形如 status:404,若要投递 status 字段为404的日志,则过滤规则为:(.*)

示例2:
指定字段名为 http_host,该键值对形如 http_host:172.16.19.20,若要投递 http_host 字段为172.16开头的日志,则过滤规则为:^(\d+\.\d+)\..*

 1. 单击【确定】,即可看到投递状态已开启。