我正在经历无盘客户端失去连接,他们的nfsroot服务器在24小时内启动。最初,我认为这与硬件有关,因为我同时将16个刀片从Centos6升级到了Centos7 (使用nfsroot进行无盘/pxe引导),它们在引导ok和运行12 hours+之后都同时失去了连接。当他们这样做,他们都打印到控制台“任务阻塞超过120秒”。我设置了一个刀片从本地磁盘启动,当复制问题时,15片无盘刀片如所述失效,带引导磁盘的刀片将一如既往地继续。nfs服务器继续为其他客户端提供良好的服务。
我的结论是,我的nfsroot连接正在失去这些无盘刀片(戴尔M620s在M1000e底盘)。没有什么有趣的东西被记录在消息文件的两端。我不认为这是硬件,因为所有的改变都是从Centos6升级到7,尽管我认为可能存在兼容性问题。硬件确实声称支持Centos7。
有人能建议好的方法来调试为什么nfsroot连接会丢失吗?内核= 3.10.0-1160.59.1.el7.x86_64
发布于 2023-01-16 07:48:52
已确认的解决方案/解决方案:向dhcpd.conf中添加以下行可防止将连接删除到nfs服务器:
default-lease-time infinite;
max-lease-time infinite;
正如bug报告https://bugzilla.redhat.com/show_bug.cgi?id=1132396中所建议的那样
https://unix.stackexchange.com/questions/731730
复制相似问题