最近,我不得不用RAID1 (2倍三星NVMe磁盘)替换CentOS7.5服务器上的一个有问题的HD。
在磁盘替换之后,服务器使用另一个驱动器引导,我用fsdisk在新磁盘上复制了相同的分区,将分区添加到RAID中,在RAID同步之后,我在新的HD中安装了GRUB:
grub2-install /dev/nvme1n1
为了使其可引导(因此,如果其他磁盘发生故障,服务器仍将能够启动)。
在我重新启动服务器之后,出现了GRUB菜单,但是在选择了任何内核之后,服务器就会错误地停止引导:
symbol 'grub_efi_secure_boot' not found
在更改BIOS中
我发现monit无法有效地监视文件系统。我添加了一个文件/etc/monit.d/disk.cnf,其内容如下:
check device disk1 with path /dev/root
if space usage > 85% then exec "/bin/custom-alert"
当我...And monit reload时,monit日志告诉我:
[PST Jan 4 14:48:39] error : 'disk1' filesystem doesn't exist
[PST Jan 4 14:48:39] info
我的操作系统是Arch Linux。当存在coredump时,我尝试使用gdb来调试它:
$ coredumpctl gdb 1621
......
Storage: /var/lib/systemd/coredump/core.runTests.1014.b43166f4bba84bcba55e65ae9460beff.1621.1491901119000000000000.lz4
Message: Process 1621 (runTests) of user 1014 dumped core.
Stack trace of t