首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
30 篇文章
1
迁移到MySQL的业务架构演进实战
2
如何优化MySQL千万级大表,我写了6000字的解读
3
MySQL中的SQL优化建议那么多,该如何有的放矢
4
说几点关于数据库的见解
5
迁移至MySQL的数据流转流程优化
6
引入TiDB方案的一些思考
7
MySQL数据克隆的用户权限设计
8
MySQL逻辑数据恢复体系的设计
9
MySQL随机恢复的设计思路
10
从Oracle到MySQL,金融核心场景在线换库落地实战
11
基于Maxwell的MySQL数据传输服务整体设计
12
MySQL数据库升级的一些坑
13
数据架构选型必读:4月数据库产品技术解析
14
基于数据库中间件配置的几类问题
15
关于中间件服务的配置管理,分为5个阶段
16
MySQL中10多张表关联要做优化,怎么理解逻辑幂等
17
关于MySQL拓扑关系的梳理
18
对于新技术栈落地和架构思维的建议
19
MyCAT让人诟病的配置文件,说说破局的思路
20
MySQL多活数据消费服务设计方案
21
数据双向复制中的6个数据冲突场景和解决思路
22
MySQL双主模式下是如何避免数据回环冲突的
23
一个MySQL服务CPU 100%的优化案例反思
24
MySQL表添加了一个字段,竟然导致数据无法写入,反思
25
MySQL周期表管理太繁琐,通过Python自定义工具方法优雅解决
26
MySQL业务双活的初步设计方案
27
数据库修改密码风险高,如何保证业务持续,这几种密码双活方案可以参考
28
一道经典的MySQL面试题,答案出现三次反转
29
​业务双活的数据切换思路设计(下)
30
基于Consul的MySQL高可用服务,健康检查怎么做?这里有一个完整脚本

MyCAT让人诟病的配置文件,说说破局的思路

最近在做MySQL分布式环境的统筹管理,目前碰到的痛点是对于集群的配置管理目前是松散的,几套环境还能忍受,如果环境多了之后还是很容易凌乱,所以我们需要一套机制来保证。

在中间件层面,Mycat的配置管理是很让人诟病的。第一层就是文件配置管理方面,我想这应该是受到诟病最多的地方了。比如增加一个周期表,按照日期来做拆分,那么每隔一段时间就需要特意维护一次,一来是扩展新表,而来是清理数据,这个过程中会操作schema.xml文件,在里面新增一些行,删除一些行,这个工作看起来繁琐而且重复度极高。

就是这样的任务配置,在最近的一些操作中竟然碰到了钉子,在此推荐的第一要则就是修改配置文件前请先备份schema.xml文件,大体来说schema.xml的配置是重中之重,但是很容易出现一些意料之外的问题:

第一种情况是出现异常导致,schema.xml文件被刷掉;

第二种情况是在schema.xml文件里面使用vim编辑,如果出现格式问题,重新加载配置文件是失败的,但是不会提示你哪一行出现了问题。

第三种情况比较诡异,即没有任何明显的配置问题,就是新增了几行,删除了几行,但是就是提示加载配置文件失败

第四种情况是逻辑问题,比如我们按照日期来进行分表,那么会产生test_20191016,test_20191017这样的表,但是每个月不是都有31天,所以我们配置的时候还是可能配置错误,比如10月份漏了第31天,导致业务写入不了数据就比较尴尬了。

对于MyCAT的这个问题,有两类解决的思路:

第一类是从上往下,也算是MyCAT创建表的一个小技巧,在较新的版本中是支持create table的。我们可以在schema.xml文件中配置记录,然后在中间件中使用create table来创建表。

这一层的难点是处理好schema.xml文件的问题。

大体来说有如下的一些流程需要注意:

创建表流程

1.备份已有的schema.xml配置文件

2.根据逻辑生成新增的对象配置

3.刷新配置文件

4.执行SQL脚本创建表

5.同步配置文件至其他中间件服务

6.检查稽核表是否连续

7.检查表是否在安全期以内

周期表删除

1.备份已有的schema.xml配置文件

2.执行SQL脚本删除表

3.根据逻辑删除对象配置

4.刷新配置文件

5.同步配置文件至其他中间件服务

6.检查稽核表是否连续

7.检查表是否在安全期以内

可以看到流程中有很多的共通之处,如果细化处理好每一个步骤,是可以很快构建出这个流程的。

第二类解决思路是从下往上,即通过底层的配置开始逐步完善,然后上推到配置中,这是一种更加通用的方式,如果配置出现一些问题,我们依然可以通过底层的逻辑关系很快构建出来。

我们可以设想几个场景,比如我们要新增一个表,那么在配置层面生效之外,还需要在数据库层面生效,至于分片的规则策略,数据节点的配置管理应该是一体化的工作,比如新建表应该是关联主从复制环境的主库来执行。

比如对一张表做变更,则不会涉及配置层面的变动,需要映射相关的数据节点即可。

比如需要对分布式环境的数据做数据流转和归档,则映射到数据节点应该是从库端去抽取数据。

比如开放集群的元数据给业务方,则对所有的业务场景都需要做到信息融合,比如开通权限,要对中间件节点开通权限即可,如果要创建账号,则需要映射到相关的数据节点上面。

所以对于这个分布式管理模式,操作层面我倒不是很担心,主要是担心这个模型层面该怎么玩。从目前我梳理的信息来看,主要包含如下的几个维度:

元数据信息涉及:集群,路由,实例,数据库,表,如下图所示:

我们分为创建表,变更表,元数据访问入口,数据流转和归档四个场景来进行模型的说明。

首先是创建表,是目前的模型设计中最为复杂的。对于元数据的整理和梳理,可以参考如下的映射关系。

最后的部分是对于配置生效,我们可以刷新中间件的配置信息生效。而纵观整个方案,其实是分成了三个较大的维度。

对于变更表来说,操作复杂度会低很多,主要涉及中间件配置和实例层的配置变动。

对于元数据提取的需求,则对中间件配置层的信息是弱化的,主要对接的是集群层面的信息。

有的同学可能会有疑问:为什么中间件层和集群层的配置都会各搞一套,其中一个原因是他们的角色和定位不同,而本质上集群层面的信息是更加通用的。

对于数据流转和归档,则主要是中间件配置和实例,表层面的信息对接,映射到从库,从从库中提取数据。

整个模型的设计需要很多细化的工作和API模式管理。

下一篇
举报
领券