前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TDSQL迁移,myloader:39626报错问题的排查与解决

TDSQL迁移,myloader:39626报错问题的排查与解决

作者头像
数据和云
发布2021-10-13 16:05:28
7760
发布2021-10-13 16:05:28
举报
文章被收录于专栏:数据和云数据和云

背景介绍

TDSQL平台下,某系统由于业务需求,要将其中三个数据库迁移至其他实例。TDSQL拥有DCN同步以及多源同步等迁移功能,但是由于前期部署规划问题并没有安装相关组件,因此综合考虑后,决定使用mydumper进行数据冷迁移。

正文

导出源数据

cd /data/home/tdsql/tdsqlinstall/mysqlagent/bin

./mydumper -u数据库用户名 -p 密码 -h 源实例网关地址 -P 网关端口 -B 数据库名 --threads=线程数 --outputdir=导出目录 --events --routines --triggers --less-locking

Mydumper参数说明

–events :备份事件。

–routines :备份存储过程和函数。

–triggers :备份触发器。

–less-locking :减少对 InnoDB 表的锁施加时间。

–ignore-sysdb :忽略 Sysdb 库和 MySQL 库。

–chunk-filesize :将表按大小分块时,指定的块大小,单位是 MB。

–complete-insert :使用完整的 insert 语句(包含列名称)。

–outputdir :导出的目录。

–complete-insert, -c :使用完整的 insert 语句(包含列名称)。

–single-transaction :该选项在导出数据之前提交一个 BEGIN SQL 语句, BEGIN 不会阻塞任何应用程序且能保证导出时数据库的一致性状态。

–add-drop-database :每个数据库创建之前添加 drop 数据库语句。

–add-drop-table :每个数据表创建之前添加 drop 数据表语句。(默认为打开状态,使用–skip-add-drop-table 取消选项)

–add-locks :在每个表导出之前增加 LOCK TABLES 并且之后 UNLOCK TABLE。(默认为打开状态,使用–skip-add-locks 取消选项)

–set-gtid-purged=OFF :这个选项可以取消 GTID 信息写入 dump 文件。

导入数据到新实例

./myloader -u-u数据库用户名 -p 密码 -h 新实例网关地址 -P 新网关端口 -v 1 --threads=线程数 --outputdir=导出目录 --enable-binlog

Myloader参数说明

–enable-binlog 启用还原数据的二进制日志。

–overwrite-tables 如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构。

导出导入的操作比较简单,需要注意的是threads配置数不宜过大,否则会过多占用DB机器的资源,最终影响业务系统的性能;另外需要先预估导出数据文件的大小,导出路径应该留有充足的空间(不建议导出到根目录)。

在导入完成后,有几个表出现如下报错:

代码语言:javascript
复制
** (myloader:39626): CRITICAL **: Error restoring cgdb.eval_rec_status from file cgdb.eval_rec_status.sql: Duplicate entry '0' for key 'PRIMARY'
** (myloader:39626): CRITICAL **: Error restoring cgdb.databasechangelog from file cgdb.databasechangelog.sql: Duplicate entry '0' for key 'PRIMARY'

与源环境进行了数据比对,发现以上报错的两个表在新环境下,创建成功但是无数据导入。

根据报错相关信息,发现这几张表并无主键,导出表语句(db.table-schema.sql)如下:

代码语言:javascript
复制
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;

CREATE TABLE `databasechangelog` (
  `ID` varchar(255) NOT NULL,
  `AUTHOR` varchar(255) NOT NULL,
  `FILENAME` varchar(255) NOT NULL,
  `DATEEXECUTED` datetime DEFAULT NULL,
  `ORDEREXECUTED` int(11) NOT NULL,
  `EXECTYPE` varchar(10) NOT NULL,
  `MD5SUM` varchar(35) DEFAULT NULL,
  `DESCRIPTION` varchar(255) DEFAULT NULL,
  `COMMENTS` varchar(255) DEFAULT NULL,
  `TAG` varchar(255) DEFAULT NULL,
  `LIQUIBASE` varchar(20) DEFAULT NULL,
  `CONTEXTS` varchar(255) DEFAULT NULL,
  `LABELS` varchar(255) DEFAULT NULL,
  `DEPLOYMENT_ID` varchar(10) DEFAULT NULL
) ENGINE=InnoDB AUTO_INCREMENT=10108 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC;

插入数据的语句(db.table.sql)如下:

代码语言:javascript
复制
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;
/*!40103 SET TIME_ZONE='+00:00' */;
INSERT INTO `databasechangelog` VALUES(‘xxx’,’xxx’,’xxx’...省略若干数据);

从以上信息可以得知这张表并无主键,但是为何会出现主键相关报错,决定去排查源环境下的表结构。

源环境下该表有一个名为tdsql_pk_auto_implicit的主键。当一个表创建时没有指定主键,那么TDSQL会自动创建一个主键,另外值得一提的是,该主键只能通过jmysql的方式才可见,业务用户是无法查到该主键的。

同理,在新环境下没有主键的表也会自动创建名为tdsql_pk_auto_implicit的主键,这样就可以理解为什么会有 (myloader:39626): Duplicate entry ‘0’ for key 'PRIMARY’这条报错了,因为插入数据的语句格式为:INSERT INTO databasechangelog VALUES(‘xxx’,’xxx’,’xxx’…省略若干数据); 并没有指定列名。

想要指定列名,在mydumper工具中可以使用参数 --complete-insert,(使用包含列名称的insert 语句)导出,结果如下:

代码语言:javascript
复制
/*!40101 SET NAMES binary*/;
/*!40014 SET FOREIGN_KEY_CHECKS=0*/;
/*!40103 SET TIME_ZONE='+00:00' */;
INSERT INTO `databasechangelog` (`ID`,`AUTHOR`,`FILENAME`,`DATEEXECUTED`,`ORDEREXECUTED`,`EXECTYPE`,`MD5SUM`,`DESCRIPTION`,`COMMENTS`,`TAG`,`LIQUIBASE`,`CONTEXTS`,`LABELS`,`DEPLOYMENT_ID`) VALUES(‘xxx’,’xxx’,’xxx’...省略若干数据);

再次使用myloader导入,成功无报错,至此问题解决。

总结

TDSQL中,无主键的表会自动创建一个名为tdsql_pk_auto_implicit的主键,该主键只能通过jmysql的方式才可见,业务用户无法查到该主键。这类表在使用myloader导入时,需要使用–complete-insert参数,生成的导入语句需要指定列名,否则会导入失败。


墨天轮原文链接:https://www.modb.pro/db/108754?sjhy(复制到浏览器或者点击“阅读原文”立即查看)

关于作者 冯睿,现就职于云和恩墨,拥有腾讯云运维工程师认证(TCA),现负责某政务云平台运维支持,有较为丰富的TDSQL处理经验。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据和云 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Mydumper参数说明
  • Myloader参数说明
  • 关于作者 冯睿,现就职于云和恩墨,拥有腾讯云运维工程师认证(TCA),现负责某政务云平台运维支持,有较为丰富的TDSQL处理经验。
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档