首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

RAS(一)介绍

RAS(一)介绍 写在开篇之前 近期收到了公司大礼包,想着在找工作期间把Linux RAS整理一下,写成系列文章。...期间也有不少其他团队过来请教过RAS事项,所以想着记录下来,对以后计划了解和学习RAS的Linux爱好者有所帮助。...另外个人视角主要从Linux内核出发,梳理Linux RAS涉及的组件、功能、特性都有哪些,也会介绍内核RAS涉及的硬件。...4.软件多样性 对于Linux驱动来说,包括mce驱动、apei驱动、edac驱动等; 对于用户态RAS服务来说,包括mcelog、rasdaemon、perf event通知等; 总体来说,RAS是一个复杂的体系...EDAC驱动会将信息保存在/dev/mcelog; 3.Mcelog是一个用户态的服务程序,通过解析/dev/mcelog信息,将其保存在/var/log/mcelog

73020

RAC一个节点自动重启问题分析

操作系统日志; /var/log/messages /var/log/mcelog dmesg日志 alert.log(grid oracle) trc跟踪日志 asm日志 /log...3、oprocd:这个进程只在Linux和Unix系统,并且第三方集群管理软件未安装的情况下才会出现。如果它发现节点挂起,则重启该节点。 注意:以上的所有进程都是由脚本init.cssd产生的。...1.MCE(Machine Check Exception)是用来报告主机硬件相关问题的一种日志机制. 2.MCE(Machine Check Exception)的日志文件是/var/log/mcelog...3.该mcelog不一定在任何一台Linux主机上都存在.只有发生硬件报错了,才会有 /var/log/mcelog. 4.在/var/log/messages文件中,也可能有mce的一点痕迹...: failed to prefill DIMM database from DMI data   -----根据工程经验:如上一行不代表硬件有问题 参考资料: Oracle Linux: Hardware

81930
领券