专栏首页腾讯云数据库(TencentDB)活动预告 | 3306π深圳站年会嘉宾专访-刘迪

活动预告 | 3306π深圳站年会嘉宾专访-刘迪

专访 3306π深圳站 数据库专场嘉宾 刘迪

会议时间:12月14日无人值守时代,数据库智能运维

会议提点:深圳 腾讯滨海大厦北塔3F多功能厅

欢迎至文末查看会议议程,报名参与!

刘迪  腾讯云 高级产品经理,网名迪B哥,中国计算机行业协会开源数据库专业委员会副会长、北京航空航天大学特聘讲师、数据库领域技术专家。拥有视频、游戏、金融、电商等行业的多年数据库架构设计和优化分析经验,曾担任腾讯视频、腾讯网、腾讯新闻、腾讯体育等业务的数据库管理和运维负责人,对外推出了《迪B课堂》、《我说》等一系列数据库实战课程。

01

刘老师你好,我们都知道腾讯作为国内数一数二的大厂,是什么样的情况下开始考虑无人值守又是从什么时候开始做无人值守相关的自动化的呢?

数据库无人值守模式的演进必然是业务驱动和开源技术驱动共同作用下的产物,是在多年的数据库运维经验积累和数以万计的实践为基础,随着AI技术的不断发展和在数据库运维领域的深入而水到渠成的。

对于数据库无人值守产品-“数据库智能管家DBbrain”的前世今生我想通过一个故事简单的跟大家分享下。

2008年~2014年期间腾讯新闻在移动端的日活跃用户增加至2.5亿,超过行业第二名的两倍。仅在第三方应用商店,下载量就达5亿次,也是第二名的两倍。

2011年后发入局的腾讯视频,在夹缝中顽强生长,在2013年从行业第八跃居行业第三。

付费会员规模在兩年时间内,实现了从2000万到8200万的高速增长。这么大业务量,引起瞬间请求量突增,需要保证秒级响应、高并发的稳定性、数据容灾、容量扩展迁移、缓存部署、数据监控上报、告警响应处理等,而处理这样庞大工作量的,是一支只有3个人的运维团队,他们支持了当时APP排行榜前10的腾讯新闻和腾讯视频业务。

在这样残酷的局面下,数据库团队开始运维智能化的探索,发现数据库运维结合微信移动化以及人工智能可以有效解决人力问题。

不断思考运维效率提升方式后诞生了DBbrain的前身智能托管平台。

DBbrain在内部经历了萌芽期后,逐渐的成熟开启支持微信红包、财付通、QQ、Qzone等内部业务,随后孵化为云服务,开始服务于私有云和腾讯内部自研上云业务线,今年8月完成品牌升级和发布,将数据库智能化能力赋能给更多的客户。

02

对于某些还停留在人肉运维或者自动化运维阶段又想做无人值守的企业来说,那么刘老师建议可以从哪些部分切入呢?

这个确实是个好问题,也正是我今年在做“数据库智能管家DBbrain”时思考最多的一个问题。

运维自动化的未来必然是智能化。但是如何开始,可能每个团队有自己不同见解。我们不妨用结果导向的思维一起来分析下,我们希望随着科技的进步,数据库运维经历了人肉运维、自动化运维以及无人值守的阶段,目的其实无非是提高效率、更好的保障业务以及提升运维核心竞争力。

那么为了达到这样的目的,在人肉运维阶段DBA需要做哪些事情呢?

  • 对接业务:和研发直接对接,进行数据库库表结构设计、SQL优化、数据拆分及版本发布等相关的工作;
  • 数据库管理:保障数据库的稳定运行、高性能和数据高可靠性进行的操作;
  •  技术架构:结合业务场景和需求,不断优化和提升数据架构的先进性。

而为了要做到无人值守的数据库运维模式,我们可以将这些工作按照紧急和重要性划分,充分的考虑投产比。实际问题也不能忽视,就是也必须考虑技术人员的技术能力和储备情况。

数据库智能管家DBbrain在探索无人值守的智能化运维道路上首先攻坚的就是从故障诊断、SQL优化。为什么从这两块入手,主要原因有两点:

1、因为故障诊断和SQL优化的工作效果和效率直接关系到业务的生命线,而对DBA来说基础的故障和优化又是在日常工作中消耗精力最多且个人收益最小的;

2、故障诊断和SQL优化在数据库运维技术的不断发展过程中也逐渐形成了一套的专家经验化流程,那么把这套流程体系或者经验程序化,加上云环境中成熟的基础建设和通畅的数据链路,能够较好的实现无人值守的模式。

我相信无人值守的智能化数据库运维将是一个不断优化的过程,也必须从最简单的开始不断深入挖掘,才能不断的完善。

03

进入无人值守的时代以后,那么传统的运维工程师会转向什么方向呢?

在这里给大家解释下或者说是澄清一下“无人值守”的概念,并不是说数据库运维技术随着智能化和自治能力的增强会使得DBA的生存空间越来越小,而是通过运维智能化的不断成熟,解放了大量DBA低价值的工作量。

但DBA的核心竞争力却会随之不断提升,其实对于DBA来说将会是更多的机遇和更广阔的舞台。

我们简要的划分下数据库运维的几个阶段,从level0(运维人工化)、level1(运维工具化)、level2(基础平台化)、level3(高级自动化)、level4(服务智能化)的演变过程中,传统数据库运维的核心竞争力也从拼体力到编写脚本工具,再到基础平台的研发能力,目的是为了更高效的服务业务,再聚焦于专家经验积累,将专家经验自动化复制,主动帮助业务提升稳定性和性能。

进入无人值守的时代,即level4(服务智能化),传统的运维工程师将不需要消耗精力在基本的性能优化、问题发现和数据收集工作上,一方面可以更好的聚焦于复杂的数据库问题,不断完善和推动运维服务智能化进程,更重要的是能够聚焦于业务逻辑架构,优化架构设计,这个才是更高的业务价值。

04

很喜欢看你的迪B课堂,可以增加更新频率吗?  哈哈哈......

首先非常感谢对《迪B课堂》的支持,《迪B课堂》的定位是面向数据库开发者、数据库运维人员、云端运维人员的系列培训课程,旨在帮助大家从入门到精通学习和使用数据库,解决数据库日常运维过程中的难题。

后续也会抽出更多的时间来给大家分享一些数据库的最佳实践和踩过的坑,也会与腾讯云DB诊断日整合,通过视频+直播的方式为大家答疑解惑,课程会在“腾讯云数据库”官方微信发出,感兴趣的朋友可以关注。

与知数堂和3306π社区的愿景一样,希望能够为大家提供一个高质量的MySQL知识传播和交流的平台,与更多的数据库爱好者共同构建MySQL的知识体系大厦。

「3306π」深圳站年会

扫描二维码报名

本文分享自微信公众号 - 腾讯云数据库(TencentDB)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 优秀的银行和电商是这样用数据库的

    12月14日,腾讯云与知数堂联合举办的3306π年会·深圳站在腾讯滨海大厦举行,腾讯云TDSQL首席架构师张文和腾讯云高级产品经理刘迪受邀分享,和与会者共同探...

    腾讯云数据库 TencentDB
  • 【迪B课堂】MySQL运行时系统CPU压力大怎么办?

    【迪B课堂】为腾讯云数据库产品经理迪B哥开设的面向数据库开发者、数据库运维人员、云端运维人员的系列培训课程,旨在为开发者解决数据库选择和使用过程中遇到的问题。《...

    腾讯云数据库 TencentDB
  • 腾讯云林晓斌:“能上能下”才是真正的云服务

    点击上方蓝字每天学习数据库 数据的价值到底是什么,数据的成本又是什么,如何高效低成本的管理数据?对于这些“灵魂”拷问,首度以腾讯云数据库负责人形象亮相的林晓斌...

    腾讯云数据库 TencentDB
  • 一个真实的DevOps演进过程是啥样的?

    前几天听老王分享,提到关于DevOps在国内外的发展问题,其中就说到早期腾讯做运维时,那个时候也没什么意识是DevOps,其实就是在变态的业务体量下面一步步做出...

    赵成
  • [golang][hugo]使用Hugo搭建静态站点

    hugo下载地址:https://github.com/gohugoio/hugo

    landv
  • 借自动化实现数据库的安全运维和跨界运维

    “不想当将军的士兵不是好的战士”、“不想当CIO的DBA不是好的运维”。在每天面临如此多的来自工作量、运维安全、技术更新挑战的同时,我们还需要不断的成长与思考:

    嘉为科技
  • DBA技能发展变化小结

    去年年底的时候,我尤其焦虑,因为圈子的缘故,我能感受到行业里的变化和趋势,所以所想和所做不能匹配的时候,焦虑难免产生。当然我们要做减法和解法。

    jeanron100
  • 腾讯织云:DevOps流水线应用平台践行之路

    持续交付是DevOps的核心工程实践,持续交付流水线驱动着DevOps的落地,昨天在云+峰会的开发者专场,腾讯跟大家揭开了DevOps流水线平台的神秘面纱。同时...

    DevOps时代
  • 老司机告诉你:正规的运维工作是什么的?

    联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    小小科
  • 云计算时代,不会编程的运维必将失业?

    在互联网时代,运维人员就是这样的存在:小到一条信息发送,大到一次网络购物狂欢,只要和IT相关的业务就需要这些运维人员,没有他们在背后的支持,企业就会出大乱子。 ...

    小小科

扫码关注云+社区

领取腾讯云代金券