降低保险行业TCO成本最好的方式是……

时至今日,“虚拟化”,“云”等名词早已耳熟能详,其提供的特性:将服务器物理资源抽象成逻辑资源,可以将一台服务器变成几台甚至上百台虚拟服务器;将CPU、内存、磁盘、I/O硬件抽象化,变成可以动态管理的“资源池”,可以提高硬件资源整合密度, 减低成本,简化系统管理,提升工作效率。

原有架构

保险行业升级测试工作较多,此为行业背景。从客户甲了解到,他所在的DBA团队一方面要承担数据库日常维护工作,另一方面也要为业务部门提供测试数据库。除去生产环境的日常维护,以下几项工作耗费较多精力:

  • 搭建维护6台Oracle Dataguard服务器,编写脚本清理归档文件等
  • 维护测试数据库环境,根据业务部需求每日搭建8台测试数据库
  • 维护所使用的几十台服务器环境

客户甲向我们倾诉工作中的苦恼:核心数据库自然不必说,再多保障也是应该的。但是一些边缘业务的数据库,数量比较多,不备份肯定不行,搭建Dataguard又存在硬件资源无法完全利用的情况。

业务方要求每天都提供新的测试数据库,因为部分数据库体量较大,需要有专人每日负责该工作,仅这 一项工作就要占用2人/天,而且重复劳动,人员积极性不高;数据库多了以后,因为多人同时维护,备份就很容易出错,有时会出现备份脚本不工作,几天之后才发现的情况。

架构示意

业务困境分析

了解到客户遇到的问题之后,我们分析发现此架构中几处不合理的地方:

1.数据重复性高

同一份数据,存在于文件备份服务器,DG服务器,测试服务器三个地方,浪费严重,原本只有20TB的数据库却要占至少60TB的空间。有DBA认为这样的做法虽然占用空间较大,但万一遇到故障,似乎可供恢复的选择也比较多,并举例说网上也有备份失效后从测试服务器恢复的案例。

不得不说这是一种极其错误的看法,文件备份作为冷备长期保存没什么问题,但因其恢复时间较长,不应作为数据恢复的首选项;Dataguard处于可读状态,配合Flashback似乎可以达到数据恢复的目的,但Flashback记录的是数据块变化,日志量相比Redo日志要高出十几倍,应用速度也比较慢,时间效率并不高;至于测试数据库,其内容随时可能被修改,更不应该当做常规恢复手段。

因此测试服务器多一份数据是没有必要的,并不会带来安全上的提升,每次导入完整数据只是无奈之举而已。

2.搭建测试数据库工作过于耗时

客户的某些数据库已达几十TB,每次导入操作对人员,带宽,IO都是极大的压力,更不用说每天都要导入一次完整数据到测试数据库,简直就是一场灾难。

经过综合分析评估,我们为客户部署一台QBackup备份容灾一体机,以替换其现有的Dataguard服务器、测试服务器。

客户收益

客户点评:部署QBackup后不仅节约了大量的硬件成本,而且创建测试数据库仅需要花费几分钟,相比之前动辄耗费一天,工作负荷大大减轻。

  • 不再需要人力维护Dataguard服务器
  • 搭建测试服务器的耗时由2人/天 缩短到1人/3分钟,对带宽、IO无消耗
  • 硬件设备减少14台

数据无价:不仅降低了TCO成本,QBackup提供的CDP备份,秒级恢复的特性还极大提高了数据安全性,而数据是无价的!

三大法宝

架构示意

QBackup如何做到如此巨大TCO成本的降低?

1、云整合  QBackup采用虚拟化技术,可以使用单台物理设备整合多个数据库的备份,非常适合于许多小规模数据库的业务环境。在此次案例中,经过分析现有设备的性能,发现大多设备的负荷处在较低水平,因此采用更高整合密度的方案具备可行性。最终帮助客户共计节约6台Dataguard服务器,8台测试数据库服务器。

2、数据副本  CDM(Copy Data Management)即数据副本管理。原有架构中测试服务器无法共用,必须分离为单独设备。经深入了解后发现原因不在于测试业务的压力,而是每次数据导入的操作都会将该设备资源耗尽,影响其他进程运行。

QBackup基于CDM技术,测试机可复用数据文件,省去了每次导入的时间、带宽、IO消耗。无需导入数据也极大缩短了搭建测试库时间,仅需3分钟即可一键创建。

采用沙盒机制,原始数据为只读不会受到任何影响,测试过程中修改的内容由单独的沙盒区域保存;省去了数据导入的消耗后,基于虚拟化创建出测试机性能上完全满足开发测试需要。

3、高度自动化管理  QBackup整合了CDP备份,CDM,虚拟化,沙盒等技术,以高度自动化的产品形态提供给客户使用,创建备份、测试数据库等操作均为一键式,大大降低DBA日常工作的负荷。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据和云

深度解析:持续交付将如何拯救IT运维?

作者简介 刘劲辉(微信号:akito_hui),前阿里移动事业群高级运维工程师,现优维科技运维与平台研发专家,专注于DevOps、应用运维和平台架构设计,参与实...

56770
来自专栏Rainbond开源「容器云平台」

【微服务干货系列】Yelp公司总结的微服务架构的实践经验

13020
来自专栏知晓程序

「大众点评点餐」小程序开发经验 07:发布与推广

李超,美团点评前端开发工程,2 年工作经验,主要负责「点评点餐」web 版、「点评点餐」微信小程序开发。

14630
来自专栏GopherCoder

『项目结构与框架:Go』

29030
来自专栏Android 开发者

[译] 从 Android Studio 切换至 D8 dexer

43940
来自专栏Aox Lei

微信公众号信息抓取方法(一)——抓取公众号历史消息列表数据

研究微信抓取之前, 看过知乎有大神写的比较完善的例子, 受到启发, 才完成了整个微信公众号的抓取。 微信公众号内容的批量采集与应用 微信抓取的难点: 1. 无法...

7.2K30
来自专栏Linyb极客之路

初识分布式架构

集群 小饭店原来只有一个厨师,切菜洗菜备料炒菜全干。后来客人多了,厨房一个厨师忙不过来,又请了个厨师,两个厨师都能炒一样的菜,这两个厨师的关系是集群。

12710
来自专栏CSDN技术头条

为什么要从PHP转向Go,及满足于使用MySQL

? 左:ElePHPant(Vincent Pontier),右:Gophers (golang.org)。此二者分别是PHP和Golang的吉祥物 【译者注...

451100
来自专栏Petrichor的专栏

Python核心团队计划2020年停止支持Python2

Python 核心团队计划在 2020 年停止支持 Python 2。NumPy 自 2010 年以来同时并行支持 Python 2 和 Python 3,但是...

17550
来自专栏企鹅号快讯

浅谈zookeeper性能的优缺点

zookeeper原本不是为高可用性设计的,但很多系统实际上是需要跨机房部署的。出于性价比的考虑我们通常会让多个机房同时工作,而不会搭建N倍的冗余。也就是说单个...

82670

扫码关注云+社区

领取腾讯云代金券