DBA生存警示:系统存储级误删除案例及防范建议

编辑手记:对于资深的老DBA们,他们在漫长的职业生涯中养成了很多稀奇古怪的守则,以在复杂多变的环境中“幸存”,这源于无数血泪的教训,我曾经在《数据安全警示录》一书收录了大量现实案例,现在整理分享给大家,共为警示。

除了数据库层面,在主机、操作系统、存储层面也有很多典型案例,如果不够谨慎,主机网络层面的误操作也可能对系统产生致命的影响。

案例分享


1.误发出系统命令

HP UNIX Oracle10.2,我用root登陆后,建立了一个新主机用户,不知不觉敲了个hostname –a,大家知道后边发生什么了吗?

是和uname -a搞混了,hostname -a直接把主机名改成-a了......

listener是监听主机名的,现在找不到主机了,连续报错,还有后台trc文件也连续报错,这个主机上共有4个实例,同时连接不上......壮观啊......很快日志占满文件系统。

查不出原因,但是发现文件系统使用得很快,就想先停库,再查原因了。结果,启动的时候都ora600了。好在是测试环境的数据库,不是正式的。真是刻骨铭心啊。

2.误切换生产存储

一次冰凉透顶的操作,去年某天下午,本来是对灾备端的盘柜做HA切换,头脑一昏,随手一按,把生产端的盘柜进行了手动HA切换,20多套数据库系统在上面跑......后果不堪设想,还好一个急智,赶快又切换回来,装作什么事没有,手一直颤抖.....过后偷偷问一些在线服务系统有没有什么异常,MM只是说有几分钟很慢,数据库没反应,过后又正常了,汗....

从此对生产环境有一种“非诚勿扰”的感觉,敬而远之。

3.存储维护危险误操作

在cx700的存储navisphere管理界面,配置一个存储。同事接过去打开了生产环境另外一个存储的IE窗口,我又接手过来,一恍惚看这个存储的配置与我打开的一样,就开始做删除storage group的操作。还好我旁边另外一个同事看主机名不对,制止了我继续删除(我当时对他讲解了一下配置存储的步骤然后开始操作)。 删除了lun就丢生产环境的CRM数据了。 这个事情很可怕,那天人状态不怎么好。以后做事情越是知道状态不好,越要加倍谨慎。还有以前删除文件用相对路径来删除,../path 方式,误删除了测试环境的oracle程序,以后都用绝对路径了。

4.误删除操作系统文件

一次在IBM p570上安装RAC,由于客户网络有问题,结果失败,在删除RAC时rm -inittab*.crsd等几个RAC的启动文件,一不留神把AIX的一个文件删了,结果系统起不来了。后来多亏IBM的工程师恢复了系统。结果晚上3点才收工。

5.误操作执行系统命令

生产环境增加节点,熬了两天两夜,同事在生产机上执行了pvid=yes 导致数据丢失,最后奋战两天重新安装RAC。

防范建议


1.超级用户和数据库用户严格分离

在生产环境中,不应该给DBA以root权限,以防止不到操作给整个系统带来的影响,即便DBA可能也很了解系统,但是专业分工要求有系统管理员去执行系统层面的维护工作。

避免因为DBA的操作不当导致的系统故障。

2.事关存储无小事

存储最终容纳着用户的所有数据,所以针对存储的任何操作都不能草率,当增减硬盘,格式化分区时,都要严格进行磁盘确认、分区比较,避免因为误操作而“釜底抽薪”。

3.电源即Power

电源也就是Power,是所有动力的来源,所以当中断电源时,系统的所有环境都可能遭受影响。在处理面对电源问题时,应当慎之又慎,因为断电而导致数据库无法启动的案例比比皆是。不要让数据库因为电源问题而崩溃。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2016-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吴伟祥

大白话Docker入门(二) 原

上篇的大白话Docker入门(一)让我们认识了docker,知道docker大概是怎么玩的。初步的印象可能会让你觉得和现在的VM的部署方式也挺像的,比如dock...

672
来自专栏GuZhenYin

C#开发移动应用系列(1.环境搭建)

前言 是时候蹭一波热度了..咳咳..我什么都没说.. 其实也是有感而发,昨天看到Jesse写的博文(是时候开始用C#快速开发移动应用了),才幡然醒悟 , 原来我...

2008
来自专栏张善友的专栏

opensuse nginx+mono 2.8支持aspx环境的配置

nginx(发音同 engine x)是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like 协议下发...

1787
来自专栏杨建荣的学习笔记

Oracle Cloud初体验

Oracle 18c自去年OpenWorld首次预发布以来,确实引起了很多DBA的好奇和兴趣,在2月份左右先行发布了部分版本(Exadata和Super...

992
来自专栏大数据架构师专家

nmap渗透测试--版本探测

所有参与活动获赠新书的童鞋,昨天书籍已经发出..只剩一本关于docker的,一直没有人认领,已经转为下期活动的奖品.再次呼吁大家,中奖后要立即联系我领奖,...

1094
来自专栏CDA数据分析师

海纳百川 有容乃大:SparkR与Docker的机器学习实战

? 题图为美国尼米兹核动力航空母舰 介 绍 大数据时代,我们常常面对海量数据而头疼。作为学统计出身的人,我们想折腾大数据但又不想学习Hadoop或者Java,...

1886
来自专栏安恒网络空间安全讲武堂

RFID技术|门禁卡破解|IC卡破解学习过程

安全不仅仅包含网络上的安全,在我们实际生活中也同样存在很多个安全相关的事物,可以说跟科技扯上关系的事物都会有安全问题,无线,蓝牙,手机,无人机,汽车。真正有问题...

4.3K2
来自专栏Java3y

应用层

DNS 服务器的管辖范围不是以“域”为单位,而是以“区”为单位。一个服务器所负责管辖的(或有权限的)范围叫做区 (zone)

972
来自专栏Hadoop实操

Cloudera Enterprise 6 Beta发布

1173
来自专栏区块链

多么痛的领悟:十三起惨痛宕机案例

社区有很多兄弟分享惨痛宕机案例,提醒大家需警惕,以下介绍几起,满满都是血的教训…… (以下案例来自社区多位会员分享,主要由社区专家孙伟光、崔增顺编辑整理) 01...

2655

扫码关注云+社区