上图是对自动化运维的一些想法,暂称为1.0版吧……刚开始又犯了理想主义,想梳理个大而全的,搞半天啥都没出来,一来在这一块没太多经验,二来业界在自动化运维也没有成形的标准,基本是各玩各的……转了一圈回到原点,还是踏实点吧,从我们自己最迫切的需求出发,先弄个简单的1.0版,再一步步慢慢迭代……
ps:经常犯理想主义,是不是当年受某大神的影响呢……
MSDB
自动化运维的基石,很重要的一个模块
已经有现成的zabbix采集,从zabbix同步基础数据即可
增加展示和编辑界面
备份管理
有效备份重于一切,备份是最后一根救命稻草,可见备份的重要程度
之前用python折腾了一个备份管理工具,有些复杂,需结合MSDB重新折腾
增加展示和编辑界面
监控
目前已经实现对主机和DB的基础监控,应该说比较完善了,接下来需要折腾更深入的监控,如性能方面……
Oracle,借助orabbix,参考某x公司的监控系统
MySQL,借助percona,参考某x公司的监控系统
日志管理
目前想到的主要是慢查询、错误日志,以及性能报告(AWR/ASH等)
慢查询,借助anemometer
错误日志,借助ELK
性能报告,已有python脚本,需增加界面
SQL审核
通过archer和inception已基本实现,接下来慢慢铺开和继续完善……
运维大屏
主要是双十一这些关键活动做展示用……
整体大屏,借助grafana
核心库单屏,借助grafana
小结
生产库上百套、专职DBA一位、无运维开发人员、挺多重复繁琐的劳动,这是我们的大概现状,运维平台对我们来说,还是蛮迫切的,但苦于缺少运维开发,大部分都需要借助开源的力量,而且目前也很难去实现复杂功能,一步一步来吧……
自动化和智能化将是数据库运维的未来,盖神说的。恩,严重同意,折腾吧……
领取专属 10元无门槛券
私享最新 技术干货