Cloud时代DBA的DevOps最佳实践 - SQL 审核

感谢IT168记者崔月对于嘉年华大会嘉宾,江苏移动专家戴建东的访谈,以下转载的是访谈实录。我们认为在Cloud时代的DBA,DevOps的最佳实践就是SQL审核,而在这个方向上,江苏移动已经取得了让人瞩目的成功经验。


2015 Oracle 技术嘉年华已经于11月21日在北京圆满结束,据主办方透露,本次大会无论在嘉宾还是报名规模上都远超了去年,仅报名参加人数就达到一千五百人左右。雨雪交加的第一日,签到处就排了长长的队伍,人头攒动,大家对 Oracle 技术的热情使整个会场暖意融融。

随着信息技术的高速发展,IT 系统在企业运营中发挥着越来越大的作用,IT 系统的稳定性和安全性常常关系着一个企业的命脉。然而互联网企业和传统企业却面对着不同的状况:以 BAT 为首的中国互联网企业都有强大且完善的运维团队,来建设系统或应对每天业务给系统带来的压力;然而相对于 BAT 这类企业,很多缺乏 IT 支持的传统企业,想要高效运维自身系统是有很大难度的。

此次,主办方邀请到了江苏移动信息技术中心架构室的资深 Oracle 数据库专家戴建东,戴总主要负责数据库维护管理以及下一代 CRM 系统架构研究。大会现场,记者就实际场景下,Oracle 系统搭建及运维过程中所遇问题及解决方式采访了戴总。

▲江苏移动信息技术中心资深Oracle专家戴建东

第三方开发对接脱节,缺乏技术支持

中国移动通信集团江苏有限公司是中国移动有限公司在江苏设立的全资子公司,作为通信行业的巨头,江苏移动在数据库系统的建设以及运维方面也有十分头疼的地方。

戴建东在采访中提到,首先,移动运营商的系统开发与 BAT 类互联网企业的系统开发有很大不同,运营商没有强大的开发运维团队,所以基本都需要第三方开发商来开发系统。在开发过程中,从移动运营商作为甲方提出需求,到第三方开发商研发上线,其中很多环节是脱节的,缺乏对接。其次,第三方开发商会考虑成本问题,他们在数据库开发上投入成本不多,且缺乏 DBA 的支持,导致一些设计和 SQL 在开发过程中效率低下。

以上这些情况都是在开发、建设期有可能出现的问题,作为系统的使用者,戴建东表示:“如果我们不能及时识别并解决这些问题,上线后极有可能出现系统性能急剧下降的情况。”现在用户对于运营商系统的要求相当高,一旦性能出现大范围波动,用户体验就会下降,带来的负面影响可想而知。

Oracle 系统遇故障,"救火"无法解决根本问题

Oracle 在数据库市场的占有率无疑是首位,很多大型企业,尤其是对数据库安全性能要求很高的企业一直视 Oracle 为不二之选。戴建东表示:“江苏移动作为通信企业,对数据库系统要求很高。我们现在基本上最核心的、跟用户密切相关的数据库还是坚定不移的选择 Oracle,”选择了适合自身需求的产品,后期运维的跟进是保证系统高质量运行的关键。

其实在生产中,绝大多数 Oracle 的业务系统出现问题都是 SQL 导致的。但是大多 DBA,尤其是偏运维的 DBA 对 SQL 并不擅长,这些 DBA 承担着数据库运维和维护稳定性的职责,而他们对这些问题可能又无能为力。原本 SQL 的质量应该是开发层负责的问题,但目前的现状是,开发人员管不了,运维很多人员不擅长。所以当系统出现问题的时候,就需要专业人员“救火”,而事发或事后救火往往是业务已经遭受了损失。

江苏移动如何应对此类问题

戴建东在访谈中分享了自身的经验,要高效运维自身数据库系统,首先需对系统和相关技术有足够了解。Oracle 每一个版本发布的时候都会带来新的特性,江苏移动更希望尝试新的技术,所以在系统中会有所应用。使用的诀窍就是,寻求专家支持,先在非核心系统尝试新技术,逐渐发现并改善对其理解上的偏差,经多次实践找到最佳方法。例如,江苏移动在技术上得到了云和恩墨的高级专家支持,与 Oracle 的 SSC 也有紧密合作。

对于上文中提到对接脱节导致的问题,以及 Oracle 业务系统问题的解决,戴建东解释道:“如果等系统上线后出现了问题再解决就已经来不及了,我们需要尽可能在上线阶段就避免这些问题。所以,我们与云和恩墨合作,引入了 SQL 审核项目,在上线过程中,通过SQL审核服务环节帮助我们检测代码,尽可能的将低质的、设计不合理的 SQL 写法在开发阶段解决掉,减少在上线后由于性能导致的故障问题。

在实践中江苏移动发现,对于数据库系统性能故障,开发人员管不了、运维人员不擅长这一现象,要解决这一问题,SQL 审核是一个最佳融合点。

那么,什么是 SQL 审核? 将 SQL 质量审核和优化这项任务,从 DB 端提取到研发端,通过擅长 SQL 的开发 DBA 和开发团队一起修正系统的 SQL,找出问题、修复问题,提升系统的健壮性和稳定性,从而保证整个系统的运维建设质量,这就是 SQL 审核。云和恩墨创始人,ACE 总监盖国强谈到此项目时提到:“SQL 审核是云和恩墨根据服务国内客户的经验,了解用户的痛点和需求之后形成的服务产品,并且在过去三年内不断投入研发形成了特有 SQL 审核产品 z3,z3 是随着行业的发展和用户的需求渐进式迭代出来的产品,符合当前运维自动化的发展趋势。在对系统性能要求极高的信息时代,我们需要帮助用户在系统上线前就将这些问题解决掉。

盖总透露,SQL 审核已经慢慢成为一种趋势,并且也应该成为 DevOps 中的一环。任何一个新产品的推出,总会经过一个用户从熟悉到接受的过程,但是在互联网的浪潮下,用户对新技术的接受度越来越高,当一个新的产品和方案能为用户带来价值、提升竞争力时,用户会以前所未有的速度去拥抱变化。

的确,为了在激烈的市场竞争中稳固增强地位,紧跟市场思维,企业对自身 IT 系统的关注远高于从前,现场不乏企业 DBA 们聚在一起探讨交流最新所获。无法到场的小伙伴们可关注云和恩墨官方微信获取相关PPT和视频资源。

另外,作为本次嘉年华最大的赞助商,云和恩墨创始人盖国强盖总也接受了记者的采访,就云时代数据库领域的发展发表了看法,没有 Oracle 的云环境是不完整的:

http://www.tudou.com/programs/view/Cl9wK0IRCO0/

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2015-12-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算D1net

2016年推动云计算全面爆发的三大关键性趋势

运维、容器以及相关培训将成为未来一年内的主要工作重点——这也意味着其应当成为大家的核心投资对象。 新年即将来临,现在是时候展望未来一年的全新趋势了,这样我们才能...

3204
来自专栏云计算D1net

2017年云计算和数据中心五大趋势

在2017年,云计算的投资将持续火爆,但是随着企业需求变化, 2017年云市场将出现如下五大趋势。 ? 多重云将成为新常态 随着许多公司投资公有云和私有云服务,...

35415
来自专栏云计算D1net

VDI实施:规划先行 成竹在胸

如今,随着企业对虚拟化技术应用的深入,VDI的实施也变得更加普遍,对于企业而言,在全面深入实施VDI之前,请对企业中的各个部门或者至少是业务部门进行调查,...

3816
来自专栏BestSDK

管好云安全,走对这3步很关键

虽然许多组织已经完全拥抱云计算,但并不是所有组织都能够完全或准确地识别、评估以及解决在云计算中快速扩展的关键安全隐患。   为了确保成功,组织需要制定和实施云计...

3337
来自专栏Netkiller

谈DELL收购EMC

谈DELL收购EMC EMC 从到高大上到姥姥不痛舅舅不爱,EMC结局并非偶然,而是必然,IBM,Sun都是它的前车之鉴。再有前车之间参考的情况下,EMC已经积...

3576
来自专栏云计算D1net

避免云混淆:成本控制的5个误区

经过初步的较量之后,云计算基础设施和服务的采用已经成为主流。短短的几年,绝大多数的科技支出将与云计算相关。这并不意味着云计算的路径是没有障碍。现在是时候制定出必...

2569
来自专栏华章科技

前沿趋势│2016年大数据领域的33个预测

2016年大数据领域会发生什么情况?考虑到如今在深层神经网络和规范性分析方面取得的进展,你可能觉得这个问题很好回答。而实际上,来自业界的大数据预测大不相同,本文...

482
来自专栏区块链技术指北

关于近期币安事件的思考

这是「区块链技术指北」的第 26 篇文章。 如果对我感兴趣,想和我交流,我的微信号:Wentasy,加我时简单介绍下自己,并注明来自「区块链技术指北」。同时我会...

2975
来自专栏区块链技术指北

「Fundamental challenges with public blockchains」解读

本文由币乎社区(bihu.com)内容支持计划奖励。 这是「区块链技术指北」的第 14 篇文章。 如果对我感兴趣,想和我交流,我的微信号:Wentasy,加我时...

3027
来自专栏Rainbond开源「容器云平台」

Docker这么火,但是你真的了解吗?

1104

扫描关注云+社区