有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
文档中心 > Elasticsearch Service > Logstash 指南 > 最佳实践 > 同步两个 Elasticsearch 集群中的数据
使用 Logstash 可以完成同步两个 Elasticsearch 集群中的数据,例如把数据从自建的 Elasticsearch 集群同步到腾讯云上的 Elasticsearch 集群,或者同步两个腾讯云上的 Elasticsearch 集群中的数据。下面介绍如何使用腾讯云 Logstash 同步两个 Elasticsearch 集群中的数据。

创建管道

登录 Elasticsearch Service 控制台,选择需要操作的实例,单击实例 ID/名称,进入实例基本信息页面。切换到“管道管理”页签,单击新建管道,创建一个管道。

进入新建管道页面,单击引用模板,同时引用“input-elasticsearch”和“output-elasticsearch”两个模板:


在管道配置中,分别针对“input-elasticsearch”和“output-elasticsearch”进行配置,一些关键的配置参数说明如下:

input-elasticsearch

hosts:elasticsearch 集群地址列表
user:elasticsearch 集群账号
password:elasticsearch 集群密码
index:索引名称
query:es 查询语句,用于查询某一部分的数据
schedule:是否开启定时任务持续从 elasticsearch 集群中拉取数据,如果不配置,则只会拉取一次
scroll:批量从 elasticsearch 集群中拉取数据时,用于保持 scroll context 的时间,默认为"1m"
size:批量从 elasticsearch 集群中拉取数据时,每个批次拉取多少条数据,默认为1000
type:标识字段
docinfo:是否在 event 中填充索引名称,type 以及 id 等文档元信息,默认为 false
查看更多参数,详情可参见 input-elasticsearch

output-elasticsearch

hosts:elasticsearch 集群地址列表
user:elasticsearch 集群账号
password:elasticsearch 集群密码
index:索引名称
document_type:索引 type,对于不同版本的 ES 集群,该字段有不同的默认值,5.x及以下版本的集群,默认会使用 input 中指定的 type 字段。如果 type 字段不存在,则该字段的值为 doc;6.x版本的集群,该字段默认值为 doc;7.x版本的集群,该字段默认值为_doc;8.x版本的集群,不会使用该字段
document_id:文档 ID
查看更多参数,详情可参见 output-elasticsearch
在配置完管道后,单击保存并部署即可创建一个管道并自动部署。



查看日志

在控制台查看 Logstash 的运行日志,如果没有 ERROR 级别的日志,则说明管道运行正常。



查看数据写入情况

进入到 output-elasticsearch 中定义的输出端的 ES 集群对应的 kibana 页面,在 Dev tools 工具栏里查看索引是否存在,以及索引的文档数量是否正确,在下图框中写入索引: