最佳实践:巧妙kill CRS进程而不导致主机重启

张大朋(Lunar)Oracle 资深技术专家

Lunar 拥有超过十年的 ORACLE SUPPORT 从业经验,曾经服务于ORACLE ACS部门,现就职于 ORACLE Sales Consultant 部门,负责的产品主要是 Exadata,Golden Gate,Database 等。

我们都知道,在RAC环境中,如果kill ocssd.bin进程,会引起主机重启。 但是有时候系统已经异常了了,且CRS不能正常关闭,而主机可能是几年没重启的老系统,没人敢重启,现在怎么办?

我们只能尝试手工kill进程的方式,然后手工修复CRS(注意,在10.2 RAC中,只有3个d.bin进程)。

测试环境:操作系统是OEL 6.6

这套RAC的CRS版本是11.2.0.4:

查看当前CRS的状态:

查看当前所有的CRS进程:

我们开始模拟kill进程。首先kill 掉/u01/app/11.2.0.4/grid/bin/ohasd.bin

如果大家了解11.2RAC的启动过程,我们会知道,kill后会自动重启 。

然后,我们kill cssdmonitor:

这里没有这个进程,表示cssdmonitor进程被重启过了

检查进程

上面进程启动时间在20:04~20:07之间的,都是被/u01/app/11.2.0.4/grid/bin/ohasd.bin进程重启后,自动后台重启的。

现在,我们kill mdnsd gpnpd gipcd osysmond。这4个进程中,前面3个是CRS启动除了ohasd以外,最早启动的几个进程。

如果kill这些进程,ohasd都会重启的:

这里我们看到,刚才kill 的4 进程都没起来,怎么回事?别急,还没到时间,ohasd需要check后才启动。

然后,我们kill 监听:

我们看到,刚才kill的进程都被重启了,11.2的RAC真强悍啊。

现在我们kill /etc/init.d/init.ohasd进程:

’这里我们看到的就是/etc/init.d/init.ohasd被系统自动重启的过程。这些信息会记录在/var/log/message/中:

而且他进程都被自动重启了(注意这是crsd进程还没被重启):

现在我们依次kill:evmlogger.bin gpnpd.bin mdnsd.bin gipcd.bin evmd.bin oraagent.bin scriptagent.bin oraagent.bin orarootagent.bin和两个lisnterner

然后,kill osysmond.bin ologgerd cssdmonitor cssdagent :

现在就剩下一个ocssd.bin了:

现在我们kill 传说中一旦被kill就会引起主机重启的进程 ocssd.bin :

好了,我们的系统都还好好的,没有重启,资源也都释放干净了:

如果要恢复,很简单,只要直接重启crs就ok了:

检查进程:

检查集群状态

这里只显示了节点1,因为节点2我关闭了。 测试证明,只要先kill cssdmonitor 和 cssdagent进程(准确的说是cssagent),再kill ocssd.bin进程,系统是不会重启的。

另外,12.1普通RAC(非Flex Cluster)的情况根本文一样,处理思路和过程也一样。

----the end

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2016-10-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏osc同步分享

others

http协议是无状态的通信协议,不会维持,每次请求后就会关闭,多以需要我们来维护用户的登录状态。维护用户的登录状态(或者说标识用户的身份信息或记录会话信息)有三...

33510
来自专栏小巫技术博客

Android Library上传到JCenter仓库实践

864
来自专栏北京马哥教育

gitlab-ce白名单设置杜绝并发数过大引起的封ip故障

gitlab-ce 7.9安装手札以及上篇文章的问题解决 鸣谢 感谢ruby大神===》章鱼的一路指点,才能拨开迷雾见云天! 章鱼大人: 国内Ansib...

47111
来自专栏FreeBuf

PowerShell-RAT:一款基于Python的后门程序

今天给大家介绍的是一款名叫Powershell-RAT的Python后门,它可以利用Gmail邮件附件来从目标用户的设备中提取数据。这款RAT可以帮助红队测试人...

1305
来自专栏ascii0x03的安全笔记

使用mitmproxy嗅探双向认证ssl链接——嗅探AWS IoT SDK的mqtts

亚马逊AWS IoT使用MQTTS(在TLS上的MQTT)来提供物联网设备与云平台直接的通信功能。出于安全考虑,建议给每个设备配备了证书来认证,同时,设备也要安...

3015
来自专栏西枫里博客

使用无线网卡连接网络,默认网关不可用的解决。

工作原因不得不使用台式机,最近挪了窝,不高兴在家横七竖八的拉网线,索性就用了一个USB的免驱无线网卡,通过这个小东西进行联网。而这几天发现网络三番两次的掉线,通...

591
来自专栏魏艾斯博客www.vpsss.net

新手使用搬瓦工 VPS 必备的软件工具

5053
来自专栏北京马哥教育

Ubuntu 17.10 已经发布,图解新功能

来源:IMCN imcn.me/html/y2017/31533....

2649
来自专栏Golang语言社区

在WINDOWS下交叉编译LINUX程序运行不了是为什么?

首先,给大家普及个知识,不管在任何平台或者任何第三方库的使用;只要你的调用的库的路径下有对应的包,是可以编译出来的。 回到主...

3227
来自专栏自由而无用的灵魂的碎碎念

Windows 10升级如何立即进行,不用等微软分批推送?

如果你已经在 Windows 7/8.1 中预订,但现在还没收到 Windows 10 推送,可以试试下面的方法加速流程!

490

扫码关注云+社区