有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
文档中心 > 数据集成 > 最佳实践 > TKE 标准输出日志全量实时同步至 ElasticSearch

业务场景

当使用腾讯云容器服务 TKE 进行业务部署时,可通过配置 TKE Agent 来采集 TKE 集群内各个 pod 的标准输出日志并投递到下游目标端(如 Elasticsearch 集群等 )。TKE Agent 是数据集成 DataInLong 提供的轻量型日志采集器,本文将向您介绍如何通过 TKE Agent 将集群 POD 标准日志全量投递到下游 Elasticsearch 集群。

操作步骤

配置项目空间

说明
若您使用的是 WeData 产品,配置项目空间操作请参见 WeData 项目列表
1. 进入 DataInLong 控制台,单击项目列表 > 新建


2. 配置项目空间信息。
参数
参数说明
项目名称/标识
项目命名与唯一标识,其中唯一标识创建后不可修改
高级设置-项目成员
为此创建的项目中添加其他项目成员,创建者默认加入项目空间
成员角色
批量为项目成员配置角色提示:此处默认为前面添加的成员添加统一的角色,后续可项目管理模块修改

配置集成资源组

说明
若有存量集成资源组,可直接操作 配置 DataProxy
1. 进入 DataInLong 控制台, 选择集成资源并单击创建


说明
若您使用的是 WeData 产品,请单击进入 WeData 控制台
2. 购买集成资源组。


TKE 日志采集是通过主动上报方式同步数据,在配置资源时候场景方案离线+实时同步(含队列)方案。选择后,系统将为资源组内置共享队列。
离线资源包与实时资源包可根据实际数据情况配置规格、以及数量。
资源组网络建议选择 TKE 集群和 ElasticSearch 数据源所在网络;若 TKE 集群和 ElasticSearch 不在一个 VPC 环境,可为 VPC 配置开通公网,详细操作参见 资源组配置公网
3. 购买完成后返回控制台。单击资源组名称,在右侧的弹窗抽屉内离线资源包使用概况 > DataProxy 规格及数量,单击编辑按钮,开启并配置 DataProxy 的数量。

4. 配置后单击确定,即可完成 DataProxy 的配置。


说明
集成资源组需包含实时资源包才可成功配置 DataProxy。
DataProxy 总规格不可超过离线包规格的1/2。
5.关联资源组与项目空间
说明
若在购买页面内已经关联资源组与项目空间,可忽略此步骤。




创建数据源

配置 ElasticSearch 数据源。进入项目管理模块,选择数据源管理 > 新建数据源 > 选择 ElasticSearch。以 ElasticSearch 数据源为例,数据连通性测试成功后,单击保存



创建配置 TKE Agent 采集器

1. 进入数据集成模块,单击采集器管理 > Agent > 创建


2. 在创建 Agent 采集器的弹窗中,配置 TKE Agent 的相关信息。


参数
参数说明
类型
请选择 TKE Agent
地域
选择需要采集的 TKE 集群所属地域,可登录前往 TKE 控制台 查看集群信息
TKE 集群 ID
选择一个需安装 TKE 集群信息提示:1. 仅支持在“运行中”状态的 TKE 集群安装 Agent 2. 一个 agent 将占用集群1C512M规格
关联资源组
将 Agent 与具体执行资源组进行绑定,Agent 将使用资源组中 manager url 进行数据上报提示:TKE 集群(Agent)需与集成资源组位于同一个 VPC,或对应 VPC 已配置公网的情况可同步数据。资源组公网配置流程请参见 资源组配置公网
配置完成后,Agent 将作为 TKE 上的日志采集器,后续支持在多个实时任务中同时使用一个 Agent 用于 POD 日志提取。

配置实时同步任务

1. 创建任务。 进入数据集成模块,创建实时同步任务,在弹出的提示框中输入任务名称和备注,选择画布模式表单模式并单击完成。

本文以画布模式为例,创建完成任务后可在任务列表页面单击新建的实时同步任务名称进入任务编辑界面。画布模式下可分别拖拽新建读取数据源和写入数据源,连接对应读取与写入节点。


2. 配置读取节点。 双击 TKE 读取节点,可在右侧抽屉弹窗中如下图所示配置需要读取的节点信息,完成后单击保存。


日志类型:选择标准输出,将默认采集 TKE 集群下任意服务的 stderr、stdout 的容器日志。
命名空间:可根据具体需采集命名空间对象指定。为保障使用性能,建议单个 Agent 采集命名空间不超过15个文件。
内容提取模式:选择全内容将默认将每条日志记录默认解析为名称为“__ CONTENT __”的完全字符串。
3. 配置写入节点。 双击 ElasticSearch 写入节点,可在右侧抽屉弹窗中配置需要写入的节点信息。

下拉至底部,配置 MySQL 与 DLC 表字段映射,完成后单击保存。选择 ES 不同资源与来源数据字段之间的映射关系。完成后单击保存。


4. 任务保存与提交。
配置完节点后,单击任务数据配置集成资源组。此资源组为已关联至本空间的资源组。
说明
此处请选择 TKE 采集器所绑定的集成资源,否则将导致任务运行失败。



完成后单击提交按钮,并在弹窗口中勾选立即启动



任务运维

提交任务后,可进入实时运维页面查看并监控任务状态。

单击运行监控,可查看当前任务数据指标统计、以及配置监控告警等。