TDSQL是腾讯云针对金融级联机交易场景推出的高一致性、分布式数据库集群解决方案。它具有高稳定性、高可用性等特点,获得了多项国际和国家认证,得到了客户及行业的一致认可。
本课程将介绍TDSQL的架构和核心技术,如数据复制方式、高一致性容灾、数据高可用性的保障机制、数据备份、安全防护、读写分离、多源同步等。课程还将介绍分布式事务的设计架构和对异常的处理。
【课程目标】
了解TDSQL的架构
了解TDSQL运用的核心技术
了解分布式事务的原理和设计架构
【适用对象】
商务、架构、开发、运维
【课程大纲】
知识模块 | 简介 |
---|---|
MariaDB(TDSQL)架构简介 | MariaDB(TDSQL)架构简介 |
腾讯云旗下面向云生态用户的一站式学习成长平台
TDSQL架构分析
目录
简介
TDSQL(Tencent Distributed MySQL)是腾讯针对金融级 联机交易场景推出的高一致性,分布式数据库集群解决方案
核心特性
高一致性、高可用性、高性能
TDSQL核心架构:
实例:从业务视角看到的一个具有完整能力的数据库
分片(sharding):是由数据库节点组(SET)和支撑系统组成一主多从数据库,也是水平拆分后承载数据的基本单元
节点(DataNode):承载分片的五里界店,一个SET通常包括一个主节点和多个从节点。
Proxy:账号鉴权、管理连接、SQL解析、分配路由的网关模块
调度集群、决策集群:作为几群的管理调度中心,主要保证数据库及诶单组、接入网关集群的正常运行;
ADS节点:扩展的计算节点,采用只读的方式与SET连接,以JDBC的方式获取数据,以spark作为基础
主备数据复制方式:
主要分为:异步复制、半同步复制、强同步复制
半同步复制的不足:超时后退化成异步,金融场景不合适;跨IDC的情况下性能不乐观
为了解决这个问题:
通过用户线程异步化,在等待返回应答时保存THD会话,让线程可以去处理别的连接,不会做无用的等待
高一致性容灾——如何保证没有脏数据
原则:
1. 主机可读可写,备机只读,备机可以开放给业务查询使用
2. 任何时刻同一个SET不能有两个主机
3. 宁愿拒绝服务,不提供错误的服务,追求CAP中的C,必要的时候牺牲掉部分A
1. 主DB降级为备机
2. 参与选举的备机上报最新的binlog点
3. Scheduler收到binlog点之后,选择出binlog最大的节点
4. 重建主备关系
5. 修改路由
6. 请求发给新的主机
数据高可用性的保障机制(恢复):
注:为了保障数据高可用性,一般用三个副本
数据备份:
物理备份:
1. 利用xtrabackup备份物理文件。
2. 每天凌晨或者指定时间点备份一次
3. 压缩备份到HDFS。
4. 可配置。
逻辑备份:
1. 利用mydumper备份工具
2. 每天备份一次
3. 压缩备份到HDFS
4. 每个库、表结构、表数据独立备份,恢复时可以单独恢复
binlog备份
1. 实时备份binlog到hdfs。Lz4压缩。
全面安全防护:
事前:IP白名单;SSL连接加密;SQL防火墙
事中:文件透明加密;网络隔离;运维安全保障
事后:数据库审计;操作日志审计;服务器审计
性能:
环境:ts85机型(x86,24核(48超线程), 512G内存, 6T SSD)
读写分离:
基于数据库账号的读写分离:
基于Hint和自动分析事物的读写分离:
分布式实践,扩展性、分布式事物
多源同步:
适用于分支>总部等业务架构;
子系统>总系统等系统架构;
Shard水平扩容:
注:在用户建表时就会在逻辑上进行打散,若用户需要扩容,就将各个节点进行搬迁,从而进行水平扩展
分表、单表、广播表:
分表:水平拆分的表
单表:不做任何特殊处理的表
广播表:每个分片(SET)都有的表
分布式事物设计架构:
采用两阶段算法(2PC)
完全去中心化、性能线性增长
健壮的异常处理
全局思索监测机制
TPCC-标准
分布式事物-异常的总结:
调用commit之前遇到超市或者失败;解决方案:直接自动回滚
调用commit的结果:
1) 成功,所有涉及到事务的节点都更新成功
2) 失败,所有的操作会回滚
3) 超时,不能立即确认是成功还是失败,但是通过select xid可以查询到事务的id,后面可以通过这个xid查询事务最终的执行结果
分布式事务性能对比:
测试方案:
采用Sysbench进行测试(每个数据库实例10张表,每个表1000000条记录,每个事物2个update,一个insert,一个delete)
256个连接,每个用例测试30分钟
测试结果:
单个proxy,单个mysql实例tps:30000
2个proxy,2个mysql实例tps:43500
分布式事务下性能是非分布式的43500/(30000*2)=72%
对比:
选型推荐:
中小规模 巨大规模
数量:<2T 数据量:>2T
Tps:<8K/s Tps: >8K/s
通用性 >容量伸缩 通用性 <容量伸缩
部署实践
数据库机器配置建议:
TDSQL自可支持虚拟化和隔离,但仍建议用物理机
TDSQL整体视图:
同城主从双中心
1、确保机房之间数据延迟小,建议采用强同步复制
2、故障时,系统会有限在本地机房选举切换
3、配置可蜕化,确保若两个机房网络终端自动退化为异步
课程学习交流
请扫码关注腾讯产业互联网学堂微信公众号