前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >搞定分库后数据冗余和数据一致

搞定分库后数据冗余和数据一致

作者头像
春哥大魔王
发布2018-09-21 11:20:58
1.3K0
发布2018-09-21 11:20:58
举报

概述

当单个数据库数据量达到一定程度后,我们可以采用多个从库解决读请求的系统瓶颈。 而写请求的系统瓶颈往往需要通过分库解决。

问题

以用户订单场景为例,用户会有查询订单需求,所以订单的分库需要基于userID做切分。

商家对订单统计纬度也同样有需求,所以单一的基于userID做切分的场景不满足这个场景了。

于是我们需要采用反范式设计来满足两种场景的需求。 采用两份数据冗余,即一份数据基于UserId,一份数据基于PoiId。

数据冗余实现

既然我们有了方案,需求指定具体的技术方案了。

做数据冗余常见有三种方案:

  • 应用层同步双写。
  • 应用层异步双写。
  • 基于底层中间件数据同步。

应用层异步双写

这是最简单的实现方式,在用户下单后,基于分库规则一份请求按userId划分入库,一份请求按poiId划分入库,数据落库才进行下一步请求,数据一致性强。

但是整个请求耗时的时间是两个入库时间的总和,如果在业务高峰期,往往造成时延升高问题,不适用于对时延敏感的系统。

应用层异步双写

将两个同步入库修改为异步入库,采用MQ异步消息投递方式实现,这样可以解决两次写入库带来的时间损耗,但是会引入MQ中间件,系统复杂度有一定的提升。

既然存在了异步队列,两个库之间存在数据不一致时间窗口,不适用于对数据一致性敏感对系统。

基于底层中间件数据同步

引入数据同步中间件,屏蔽了业务层实现数据同步,数据冗余的细节,而是交由底层同步中间件实现,使得开发人员专注于业务开发。

与第二种方案相比,中间件方式基于mysql的binlog实现,所以数据一致窗口更短,可靠性更高。

数据一致性

当然以上三种方式的后两种方式都是异步方式,在分布式场景下都会存在数据一致性问题,强一致性很难,一般业务系统都采用最终一致性。

为保证数据一致性可以采用:异步检测,异步修复。

异步检测

采用离线工具,或定时任务,定时对离线数据源进行扫描,如发现数据不一致进行补偿修复。

数据源扫描粒度视对一致性要求的强度而定。但是大量的数据扫描,耗时较长,效率较低。

为降低全量数据扫描的效率问题,可以设计增量数据扫描方式,设置更适合系统负载的扫描时间窗口,提高扫描检测效率。

如果想更实时扫描,可引入同步扫描方式,引入MQ推送消息,在订阅者接收到消息时,触发数据扫描,扫描时间窗口期内数据,同时进行修正。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 春哥talk 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 概述
  • 问题
  • 数据冗余实现
    • 应用层异步双写
      • 应用层异步双写
        • 基于底层中间件数据同步
        • 数据一致性
          • 异步检测
          相关产品与服务
          云数据库 SQL Server
          腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档