服务挂上rbd正常读写,经过很长时间之后再次发布就会出现timeout的错误,导致服务无法启动,但是如果强制把服务缩容到0,然后再发布改成1,这样就能启动成功,短时间内再次进行发布操作,rbd挂载 卸载又很正常了,故障再不会出现了
rbd map rbd19 --id admin -m xxxx --key=xxxxx
timeout expired waiting for volumes to attach or mount for pod
挂载rbd超时
ceph版本小于ceph version 12.2.8-291时, rbd在低版本中有瑕疵, rbd map后需要检查内核udev返回的两个事件,一个事件是rbd,一个事件是block,这2个事件不一定是有序的,但是rbd命令里检查这2个事件是有序的,就会导致可能漏掉了一个检查,永远在等待,其实rbd已经map上了。
rbd map进程卡住之后,kubelet迟迟等不到进程的正常返回,进而判断map超时,于是就是打印'timeout expired waiting for volumes to attach or mount for pod'
升级ceph-common