tungsten replicator:数据迁移利器【mysql 数据同步到 mongodb】

导语

tungsten-replicator 是一款开源的、高性能、跨数据库系统的复制引擎,可用作多种场景下的数据迁移组件。本文尝试利用该工具实现 mysql 数据到 mongodb 的同步。

一、初始环境设置:

  • 103 主机:mysql 服务器,开启 log-bin,binlog_format 设置为 row 格式;端口 3700;安装过程不赘述
  • 104 主机:mongodb 服务器;端口 225032;安装过程不赘述
  • 两台机器有一个同名的账户,这里用默认的机器账户 webroot,两台机器配置信任关系,相互之间可免密码登录

二、配置同步账户:

登录 mysql 主机,为 tungsten-replicator 进程授权,因为这里 tungsten-replicator 是本机安装,故授权 ip 是 103;权限类型至少需要 replication slave、replication client、create database ,还需增删查改,建议授权 all privleges.

  • grant all privilegs on . to tungsten@'103' identified by ''tungsten;

三、下载 tungsten-replicator:

四、解压安装:

在 103 主机执行如下操作:

tar -zxf tungsten-replicator-2.2.0-292.tar.gz cd tungsten-replicator-2.2.0-292 ./tools/tpm install mysql2mongodb --dataservice-schema=qqnews_main --datasource-mysql-conf=/data/webroot/myrocksandmysql57/mysql57/etc/my.cnf --enable-heterogenous-master=true --install-directory=/data/webroot/tp_mysql --master=10.62.19.103 --replication-password=tungsten --replication-user=tungsten --skip-validation-check=InstallationScriptCheck --skip-validation-check=MySQLDefaultTableTypeCheck --start-and-report=true

在 104 主机执行如下操作:

tar -zxf tungsten-replicator-2.2.0-292.tar.gz cd tungsten-replicator-2.2.0-292 ./tools/tpm install mysql2mongodb --datasource-type=mongodb --enable-heterogenous-slave=true --install-directory=/home/webroot/tp_mongodb --master=10.62.19.103 --members=10.49.82.222 --replication-port=25032 --skip-validation-check=InstallationScriptCheck --start-and-report=true --topology=master-slave

参数解释:mysql2mongodb 是服务名字,唯一标识一对数据迁移服务;mysql 端通过 master 参数、datasource-mysql-conf 中包含的端口信息、replication-user、replication-password 信息连接上指定实例,之后同步 dataservice-schema 库数据;mongodb 端通过 members 参数、replication-port 连接指定的 mongo 实例(也可以是 mongos 入口),然后进行同步。如果 mongo 端同样做了授权:详细参数参见 ./tool/tpm help install 。

执行完成后,看到 state 是 ONLINE 状态即说明成功。此时可以看到在 install-directory 目录下如下:ls backups relay releases service_logs share thl tungsten

这步骤安装时候一直不能通过:当时报错是:

原因为配置 ssh 信任关系时候,两台机器可以相互登录,但本机不能免密码登录本机。分别将自己的密钥添加到认证文件中就好了;

另公司内为了安全,ssh 端口非默认的 22,那么这步安装时候要加参数: --net-ssh-option=port=36000 。

五、查看同步状态:

cd /home/webroot/tp_mongodb cd tungsten/tungsten-replicator/ ./bin/trepctl status Processing status command... NAME VALUE ---- ----- appliedLastEventId : mysql-bin.000450:0000000000003937;59 appliedLastSeqno : 47980 appliedLatency : 0.635 channels : 1 clusterName : mysql2mongodb currentEventId : mysql-bin.000450:0000000000003937 currentTimeMillis : 1475138537477 dataServerHost : 10.62.19.103 extensions : host : 10.62.19.103 latestEpochNumber : 47957 masterConnectUri : thl://localhost:/ masterListenUri : thl://10.62.19.103:2112/ maximumStoredSeqNo : 47980 minimumStoredSeqNo : 0 offlineRequests : NONE pendingError : NONE pendingErrorCode : NONE pendingErrorEventId : NONE pendingErrorSeqno : -1 pendingExceptionMessage: NONE pipelineSource : jdbc:mysql:thin://10.62.19.103:3700/ relativeLatency : 88699.477 resourcePrecedence : 99 rmiPort : 10000 role : master seqnoType : java.lang.Long serviceName : alpha_mysql serviceType : local simpleServiceName : mysql2mongodb siteName : default sourceId : 10.62.19.103 state : ONLINE timeInStateSeconds : 179684.874 transitioningTo : uptimeSeconds : 179687.108 useSSLConnection : false version : Tungsten Replicator 2.2.0 build 292 Finished status command...

输出解释:status 状态表示同步进程工作状态,若有报错则会在这里看到。

起停同步进程:

cd /data/webroot/alpha/tungsten/tungsten-replicator ./bin/replicator restart

上下线数据迁移服务:

./bin/trepctl offline

默认是基于 binlog 全库开始同步,指定同步特定库表:

cd /data/webroot/alpha/tungsten/tungsten-replicator ../tools/tpm update mysql2mongodb --repl-svc-extractor-filters=replicate --property=replicator.filter.replicate.do=qqnews_main.test_fulltext

从指定的 pos 点开始同步:

cd /data/webroot/alpha/tungsten/tungsten-replicator && ./bin/trepctl offline ./bin/trepctl online -from-event mysql-bin.000006:1029

六、验证数据同步效果:

mysql 端建立一张表,并插入一条数据; use qqnews_main;craete table t (id int);insert into t set id=1;

mongo 端进行验证: use qqnews_main;db.t.find();

该步骤如果执行完成后,数据未能实时同步,可以通过./bin/trepctl 的输出配合进行调试。

七、缺点:

  • 通过 tungsten-replication 同步之后的数据没法进行 check 比对,只能依赖业务层面 check
  • 基准数据需要人工导入
  • 部分 DDL 语句不能正常同步,如 drop table;drop database 等

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏从零学习云计算

Docker学习记录(4)——docker pull默认从本地镜像仓库拉取镜像

主机操作系统为Centos7.3,内网环境下使用docker pull,直接从本地镜像仓库下载镜像。 本地镜像仓库的搭建方法多样,这里不做记录。 我的本地...

2480
来自专栏编程坑太多

跟我一起学docker(12)--docker compose的使用

1755
来自专栏行者常至

Servlet运行的详细步骤

972
来自专栏pangguoming

Windows下使用xShell向远程Linux上传文件

上传文件使用rz与sz命令,远程Linux系统上需要安装lrzsz工具包 下载安装包lrzsz-0.12.20.tar.gz:  http://www.linu...

4564
来自专栏Laoqi's Linux运维专列

安装配置kibana+logstash

1492
来自专栏成长道路

KAFKA的安装配置

一、kafka单机部署 1. 上传kafka_1.20-0.10.1.0.tgz到linux 2. 解压 tar -xzvf kafka_1.20-0....

2450
来自专栏小狼的世界

Kubernetes命名空间

Kubernetes中提供了命名空间,但是如果你的团队规模比较小并且集群规模也不大,完全可以不用Namespaces而使用labels来区分不同的资源,随着项目...

1431
来自专栏运维一切

私有镜像库的验证问题 原

解决方案完整的例子 https://docs.quay.io/issues/quay-mesos.html https://mesosphere.github....

652
来自专栏运维小白

11.3/11.4/11.5 MySQL安装

MySQL目录概要 MySQL的几个常用安装包:rpm、源码、二进制免编译 cd /usr/local/src //切换到下载源码包的目录 wge...

2065

Docker-如何清理磁盘占用

最近开始打包我们的一些应用,不得不说,我已经爱上了Docker这个工具。在AWS EC2上,它的存在使我们的工作方便了许多。然而,我们遇到的唯一问题是Docke...

3167

扫码关注云+社区