超级微型主板包含一个名为“监视狗功能”的BIOS功能。使用内核“2.6.32-5-AMD 64 #1 SMP”的Debian 6.0.6,我们做到了:
# apt-get install watchdog
)期望:这将是所有的看门狗功能被正确安装。
结果:系统每(大致)5分钟重新启动一次。
将BIOS“监视狗功能”从启用更改为禁用修复不需要的重新启动。
引导进程似乎正确地启用了看门狗守护进程。至少显示控制台(当禁用BIOS监视狗时):
Starting watchdog keepalive daemon: wd_keepalive.
Stopping watchdog keepalive daemon....
Starting watchdog daemon....
在重新启动时,将生成此输出:
INIT: SUsing makefile-style concurrent boot in runlevel 6.
Stopping watchdog daemon....
Starting watchdog keepalive daemon....
要配置BIOS监视狗函数和Linux看门守护进程以正确地协同工作,还需要做什么?
发布于 2013-09-04 16:53:25
首先,为了真正“喂”看门狗,你需要加载看门狗硬件模块。这可能不会自动发生,因为大多数看门狗驱动程序都被列入黑名单,以防没有看门狗守护进程(例如,在Ubuntu/Debian系统上的/etc/modprobe.d/blacklist-watchdog.conf
中)。检查是否出现了/dev/watchdog
(或类似的),因为这意味着模块已经加载。
我不知道超级微型板的用途,但它可能是英特尔的TCO驱动程序(iTCO_wdt
)。请注意,iTCO_wdt
可能需要一些其他模块(如i2c-i801
、i2c-smbus
)才能发挥它的神奇作用。尝试使用modprobe iTCO_wdt
加载该模块,并查看它是否被接受。
成功看上去像是:
iTCO_wdt: Found a Intel PCH TCO device (Version=4, TCOBASE=0x0400)
iTCO_wdt: initialized. heartbeat=120 sec (nowayout=0)
失败在以下几个方面都没有显示:
iTCO_wdt: Intel TCO WatchDog Timer Driver v1.11
还可以查看syslog。否则,请查看IPMI工具,因为它们包括一个看门狗驱动程序。
/etc/watchdog.conf
其次,您需要编辑看门狗配置文件,比如# nano /etc/watchdog.conf
。
watchdog-device = ...
因此,实际使用/dev/watchdog
设备访问模块。否则,看门狗将不会使用硬件,而只依靠其内部代码来软地重新启动损坏的机器(这不是很有用)。
同样,在启动看门狗守护进程时,请在syslog中查找有关它启动的消息以及它找到的硬件模块。
https://unix.stackexchange.com/questions/64057
复制相似问题