问题描述
某客户打电话过来说他不小心把数据库服务器(Standalone Server 数据库)的软件目录全删掉了,数据库也已经宕掉了。沟通中了解到出问题的虽然不是生产环境,但影响开发人员工作,误删之后影响很严重,而且电话中客户很着急,我们决定马上去现场处理故障。
处理思路:
1、在原机器清理原始信息后,重装软件、注册数据库后启动。(相对更快,但清理过程较繁琐些)
2、或者新开一台机器,安装软件,ASM磁盘可见访问,注册ASM磁盘即可(准备环境时间较长)
处理过程
GRID处理:
2、DB处理
至此数据库删除软件安装目录,恢复完成.
问题总结
恢复流程:
1、清OCR注册信息
2、重装GI软件,重配置注册OCR
3、添加CSSD资源并启动
4、编辑ASM参数文件,并MOUNT数据磁盘组DATA
5、重装DB软件
6、srvctl 命令添加数据库
7、open数据库
其实运维人员手误(RM,MV等命令)在生产环境也造成过很多严重故障, 就是多敲了个空格后,再快手接了一个回车而频频登报的一种,对于这类运维故障,当然最推荐的是通过引入自动化运维,减少人工的误操作。在没有自动化运维环境,我们建议在操作系统层面bash_profile 里做如下绑定,对危险操作给多一次机会做确认:
做了以上绑定后,再次删除时,会提示是否删除如/home/oracle/xxxxx,而且要确认的次数非常多,可在技术层面极大减少这类误操作。同时也需要提醒运维人员,在敲下去回车之前一定再三检查,避免产生重大故障。
领取专属 10元无门槛券
私享最新 技术干货