前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用mirrormaker工具同步CDH-kafka数据到TBDS-kafka

使用mirrormaker工具同步CDH-kafka数据到TBDS-kafka

原创
作者头像
袁宋
发布2020-12-07 21:21:12
8250
发布2020-12-07 21:21:12
举报
文章被收录于专栏:大数据平台TBDS大数据平台TBDS

把CDH集群的kafka数据同步到TBDS的kafka集群做测试,可以使用自带的mirrormaker工具同步

mirrormaker的原理可以网上查看,详细的命令参考https://my.oschina.net/guol/blog/828487,使用方式相当于先消费CDH的数据,然后再生产到TBDS集群中。

mirrormake到配置及命令启动都在目标集群上,所以下面的操作都在TBDS集群上

1.因为TBDS kafka有开启认证,所以mirromaker指定的生产者配置文件--producer.config  target.producer.configure需要加入认证,同时连接的端口使用6668(TBDS kafka认证方式有两种,社区的开源认证方式为6668端口,TBDS自研认证使用6667端口),我们使用社区的开源认证方式访问

bootstrap.servers=172.0.x.x:6668,172.0.x.x:6668,172.0.x.x:6668 ##TBDS的kafka broker地址 message.max.bytes=7000000 fetch.message.max.bytes=7500000 max.partition.fetch.bytes=7500000 replica.fetch.max.bytes=7500000 security.protocol=SASL_PLAINTEXT ##加入开源认证配置 sasl.mechamism=PLAIN ##加入开源认证配置

2.消费的集群是CDH集群,客户的CDH集群本身没有开启认证,所以–consume.config target.consume.configure配置文件就按照社区方式配置即可

bootstrap.servers=10.x.x.x:9092,10.x.x.x:9092,10.x.x.x:9092 ##CDH集群的kafka broker地址 message.max.bytes=7000000 fetch.message.max.bytes=7500000 max.partition.fetch.bytes=7500000 replica.fetch.max.bytes=7500000 group.id=xxxx ##原集群的kafka topic group

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据处理套件 TBDS
腾讯大数据处理套件(Tencent Big Data Suite,TBDS)依托腾讯多年海量数据处理经验,基于云原生技术和泛 Hadoop 生态开源技术对外提供的可靠、安全、易用的大数据处理平台。 TBDS可在公有云、私有云、非云化环境,根据不同数据处理需求组合合适的存算分析组件,包括 Hive、Spark、HBase、Flink、presto、Iceberg、Alluxio 等,以快速构建企业级数据湖、数据仓库。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档