上班第一天,一个合格的运维应该做什么?

运维行业正在变革,推荐阅读:30万年薪Linux运维工程师成长魔法

作为一名运维工程师,如果你在春节放假期间没有被报警电话和邮件吵醒过,那说明你在放假前的准备真的非常出色。如果你的准备不够充分,下场请参考微博运维小哥:

尽管你取得了阶段性的胜利度过了一个清净的假期,但现在可还不是掉以轻心的时候!

上班第一天,不做这些事情的运维是不合格的哦~

1

对硬件设施进行全面体检

不同的企业对IT设备的运维有不同的标准,有些公司节假日期间可以部分停机,有一些公司必须7*24小时的运行。在假期里勤勤恳恳工作的机器们有没有出现什么问题?首先让我们对硬件设施进行全面体检吧!

PC机的检测及准备至少应该包括以下几个方面:

(1)、对PC机的硬件进行检查,包括电源、硬盘和网卡等。

(2)、要安装操作系统的最新补丁包,还要对杀毒软件的病毒库进行更新。

(3)、将最新的应用程序和数据做备份。

注意点一:UPS不间断电源检查

电源检查往往是容易被忽视的一环。如今大部分企业的业务需要7*24小时不间断运行,甭管是自动还是手动,反正不能停。那么选用UPS电源习以为常。UPS的新旧或者老化程度如何,能否在服务器出现异常情况时,实现正常关闭服务器的效能。需要对其进行检查,其出现故障的概率有多高,故障的自动应对举措有哪些,都需要预先思考周全。

注意点二:电缆线路与布线情况查看

对连接服务器的各条线路进行精细查看,关键是检查配线箱,看看插座是否对应插头,不插头与非适配插座乱串。电缆线路正常传输和布线合理与否都将影响到服务器正常运行情况,务必查看清楚。若有异常,最好找电缆线路的承包商来进行修复或优化。

2

服务器的检测及其准备

(1)、在适当的时间对服务器进行进行一次冷关机断点,然后对其电源、硬盘、网卡、风扇等进行检查,确保其性能良好。

(2)、如果服务器做了RAID,一定要检查RAID卡和热插拔硬盘工作状态是否正常。

(3)、清理文件系统的历史数据,要保持文件系统有足够的可用磁盘空间。

(4)、清理数据库的历史数据,保持数据库有足够的可用空间。

(5)、备份应用程序和相关配置参数。

(6)、检测确保备份服务器,确保其有足够的磁盘空间。

注意点一:系统补丁是否安装完备

补丁较容易配置而且是免费提供,但有些网管可能会觉得系统运行效果不错,无需为其打补丁。然而伴随补丁而来的大量漏洞修补却是至关重要的,对服务器安全有莫大助力。长假之后通常有许多补丁释出,这个工作量可不小。

注意点二:数据备份忘不得

企业数据一旦丢失是“致命”的,防止数据丢失,对服务器数据进行备份必不可省。别企图在服务器上某一区新建备份文件夹或者建立一个备份区,如果仅仅只做此项工作,如此备份方法仍非常危险,一旦服务器的硬盘区“失火”,那么所有分区的数据就将统统“销声匿迹”,如此备份有后患。建议外置使用专门单独时设备对数据进行二次备份,可使用较普遍的交叉备份方法或者成本较高的磁带。

此外,已备份的数据也有可能发生被盗,建议网管在备份时能够通过密码对备份介质进行保护。

注意点三:强化服务器本地文件格式安全级别

服务器安全检查有来自自身设备问题,很大一部分来自防范外部攻击。因此有必要在假期结束后确认检查服务器本地文件格式级别是否够高,别给黑客可乘之机。检查服务器操作系统是否已经对用户访问权限进行限制,避免因用户使用统一访问服务器的权限而存在不安全因素。

同时,网管需检查系统是否使用了相关的网络检测软件对企业网络运行情况进行全天候监视。

3

对于交换机/路由器的检测及其准备

(1)、在情况容许的情况下对交换机/路由器进行重启对其功能进行检测,测试的项目诸如接口测试、性能测试、协议一致性测试和网管测试等,测试最好进行远端测试。

(2)、对其进行卫生清洁是非常必要的,最好能够打开交换机/路由器,清除其主板电路上及其外围的灰尘,因灰尘导致的故障也是屡见不鲜。

(3)、备份也是必须的,诸如思科路由器的IOS备份和网络配置备份,最好将其备份到一个固定的地方,例如专门用于备份的某UNIX主机的某个目录下或者某个专用的备份移动硬盘。

4

维护运维平台

节日期间,因为无人值守,我们通常会选择运维监控平台来进行系统实时监控防止出现问题。在假期的使用过程中,你有没有发现平台的bug或者某些不尽如人意的地方?

为了下一个假期里更加安心,大胆的整理你的需求然后提交吧。在节日期间,实时监控的运维平台就是运维人员的“眼睛”。

以笔者的经验,运维平台要能监控全面,最好能在一个平台里对整个系统进行监控,把系统中所有可能出现故障的环节都进行监控,并且能设置相关预警,以便运维人员在系统出现异常信号的时候及时处理,防止出现故障后进行补漏。

另外,对于运维平台最少必须能支持实时告警,以短信方式实时将系统中的异常信号发送运维人员,以便运维人员及时准确的掌握系统运行状况。

5

关闭远程维护渠道

休假在家,常规的远程维护还是必须的。当然,如果网络出现故障,远程维护当然是最快捷、高效的手段了。因此,在假期里一定要确保远程维护渠道的畅通。

但是现在假期已经结束,为了安全还是将通道关闭吧。另外也别忘记查漏补缺,下一个长假里我们还是很需要它的。

6

回顾假期工作

做完以上紧急事项后,是时候对自己的假期工作做个总结了。

先看一下自己在假期中的所有往来邮件及文档,从中对自己假期的工作内容进行汇总、分析,并提炼出主要内容,分析假期成绩、反思假期不足,给自己一个收获满满的假日。

工作总结建议使用X-mind,有免费版可以使用。上班第一天,工作总结和思维导图更配哦~

7

列个清单出来

做完工作回顾之后,你应该已经可以列出一个待办事项清单了。

首先是对于任务中能立马跟进的事情,比如之前已经发出对方还没有回复的邮件可以再发一封作为提醒。

对于比较复杂难以立马解决的任务,分类汇总列出来。列表的时候要注意,如果一开始就进入到方案设计等复杂的工作中,可能会比较难打开思路。优先处理沟通协调类的工作,例如信息同步、邮件跟进之类。

这里还有个小心机,一般工作的第一周都会有周会,做好以上几件事情,就能做到未雨绸缪。

最后,希望笔者的经验对大家有所帮助。


原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2018-02-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏沃趣科技

隔壁老王的数据备份“变形”记

隔壁老王作为一名合格的DBA 守护数据安全是他不可推卸的责任 比如每一次的数据库备份 可是你懂的 那备份的速度 ? 于是乎 兢兢业业的老王一边盯着屏幕 一边若有...

43170
来自专栏鹅厂网事

透过MH370看网络自动化监控

引子 MH370已经消失4个月了,这个严重的灾难也被蒙上了神秘的面纱,找不到消失的任何记录。也意味着,马航无法确保这种事情不会再次发生,人类生活在恐惧...

22390
来自专栏Web 开发

我也来刷到CM7.1

2011年10月10日,著名的的Android第三方ROM团队CyanogenMod发布了最新的稳定版CM7.1,同时提供大量机型的支持~

8300
来自专栏大数据文摘

深度解析12306数据泄露之谜

32220
来自专栏IT笔记

三分钟读懂TT猫分布式、微服务和集群之路

针对新手入门的普及,有过大型网站技术架构牛人路过,别耽误浪费了时间,阅读之前,请确保有一定的网络基础,熟练使用Linux,浏览大概需要3-5分钟的时间,结尾有彩...

327100
来自专栏程序人生

从 gitlab 事件中吸取的教训

题注:这是一篇去年的文章,今早看到 gitlab 运维人员愚蠢地 rm -rf, 心有戚戚焉,故而重发这篇文章,供大家参考。 ---- 这两天不是很太平,程序圆...

396100
来自专栏知无涯

Ubuntu 15.10 中文桌面版/服务器正式版下载 - 华丽免费易于入门的 Linux 操作系统

661100
来自专栏大数据挖掘DT机器学习

python爬虫+R数据可视化 实例

Python 和 r语言这对黄金搭档,在数据获取,分析和可视化展示方面,各具特色,相互配合,当之无愧成为数据分析领域的两把利剑。该项目分为两个模块: 1,数据准...

50240
来自专栏FreeBuf

看我如何破解一台自动售货机

毫无疑问,自动售货机是非常受欢迎的东西,我们总会从中购买获取一些小零食。早几年前,自动售货机只接受离线的硬币支付,之后,也慢慢采用了普及的NFC技术功能。如果我...

2.2K30
来自专栏工科狗和生物喵

总算搞定了域名(好吧,我一开始忘了)

正文之前 我是从大二下学期开始入程序员这个坑的。那个时候恰逢遇到了我计算机方面的启蒙学长,然后他带着我走了一段很长的路,其中就包括网站建设这个方面。我前端后端都...

753130

扫码关注云+社区

领取腾讯云代金券