首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么说不要把“希望”全部寄托在“自动化运维”?

运维项目经理的任务之二是不要把希望全部寄托在自动化运维上。

这听起来矛盾,实际上完全符合客观规律,我们做任何一个复杂的事情都不是靠一招鲜,而是多头并举。一套大型核心生产系统,上线后半年内是稳定期,其后的一年是优化期,这和汽车磨合有些类似。无论稳定还是优化,都需要我们主动做一些事情。

1.定期巡检包括晨检、日检、月检,每季度的优化巡检。

2.系统日常优化包括每日抓取效率低下的SQL语句TOP10,增加完善网管监控点,数据模型的生命周期管理,对部署、配置参数的不断调整,对平台软件、中间件的打补丁、升级等。

3.专项优化专项优化建立在日常巡检数据的记录分析、连续的故障、系统长时期反应缓慢或专门的健康检查基础之上,某些公司专门提供这种服务。主要由数据库、网络、存储、中间件等专家实施,也有一些很高级的工具软件支持这类优化。

这里技术含量最高的是应用系统与各类平台类软硬件的结合,找到最佳的部署、配置、代码方法。

化工生产车间有操作规程,IT生产车间也需要。一类是管理规程,一类是技术操作规程。前者主要用来约束生产操作纪律、工作处理流程。

比如约定短信告警的处理时限,出现重大故障后的处理方法、报告顺序、生产系统的安全管理规范等。非常多,也好理解,只是要加强教育、演练,让所有人记住。技术操作规程也不难,就是把各种生产操作方法固化下来,形成规范、工序、标准。难的是建立规程的过程。如同新企业与老企业的区别一样,一个新的办事处、分支,在成立最初的两三年里,重要的任务是形成各种规程,这是一个不断总结、吸取教训、积累经验的过程。

几乎所有生产事故都可以归纳出管理上的漏洞,或者执行上的偏颇。有时候我们觉得用尽了一切方法,使尽了一切努力,还是会出故障。这时,你只需再坚持一下,曙光可能就在前面。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200607A03OFT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券