我想在monit中做一些类似的事情:
check process foo with pidfile /var/run/foo/foo.pid
start program = "/etc/init.d/foo start" with timeout 30 seconds
stop program = "/etc/init.d/foo stop"
if does not exist then restart
if does not exist for 3 cycles then alert
但是monit似乎用第二个覆盖了第一个“如果不存在”的检查
我正在运行负载均衡,将传入的请求分派到两个CPE实例。 它在某些天运行得很好,在另一些天,实例在没有明显原因的情况下被重启,所以所有的进程(主要是tomcat)都被终止了,用户收到了错误。 我没有运行可抢占的VM实例(我已经根据Why do my google cloud compute instances always unexpectedly restart?进行了检查) 如何找出实例重启的原因?这种经历变得越来越令人沮丧。在切换到GCP之前,我曾经运行过一组廉价的托管服务器多年,从来没有遇到过任何问题--而且它的成本要便宜得多。我认为我会获得更好的性能和更好的可伸缩性,但如果整个设置不