我在节点上有一个带有IPMI接口的Intel linux集群。最近,IPMI接口一直在运行。例如,我不能再使用IPMI命令将节点引导到PXE,并且通过IPMI重新启动它们有时是可行的,但并不总是有效的。我最近发现可以用ipmitool测试底盘和BMC,这就是输出:Self Test Results : device error[FRU Internal Use Area corrupted]
# ipmitool bmc
我们知道我们可以使用下面的方法来打开/关闭服务器: power down:ipmiutil power -d -N fsp_ip_address -P ipmi_password
power on:ipmiutil power -u -N fsp_ip_address -P ipmi_password 但是我们如何检查电源状态呢?
我有两个相同的机器(超级微型X8DTU-F主板与2 Xeon E 5520‘S,DDR3 ECC,没有硬盘驱动器,没有额外的PCIe设备)。然而,这些机器中有一台速度非常慢--通过BIOS/POST需要花费大约10-20倍的时间,而且一旦启动,速度就太慢了(这两台机器在PXE上启动相同的CoreOS配置)。我已经在这两台机器上重置了BIOS设置,我还可以确认这两台机器都有相同的BIOS版本。因此,在我看来,这是一个硬件问题。但是,我从来没有遇到过导致机器像这样减速的硬件问题,而且我也找不到系统的任何明显的硬件错误报告(似乎没有任何故障,只