我们已经建立了集群,VM从2扩展到5,上面运行着5-6个吊舱/容器。我们还为路由设置了ngnix,并且一切运行都很完美。
但我们在谷歌集群上遇到了问题。它会自动重建,所有VM也会被重新创建,这会导致豆荚在上面运行时出现问题。在集群软件更新设置中,我们已经将发布通道设置为none。我们假设这是由于GKE集群的软件升级而发生的。
请告诉我们如何检查它。
发布于 2021-05-12 17:47:29
我们假设这是由于GKE集群的软件升级而发生的。请告诉我们如何检查它。
你的假设可能是对的。它可以与自动升级功能相关,就好像它只是由于自动分词器,只有当集群被缩放并再次缩小时,您的VM才会被重新创建。因此,由于启用了自动升级功能,您的VM很可能被重新创建.
要运行检查现有节点池的自动升级状态。,请运行:
gcloud容器节点-池描述节点-池-名称--集群-名称-区域计算-区域:
node-pool-name是节点池的名称。cluster-name是包含节点池的集群的名称。compute-zone是群集的区域。并搜索autoUpgrade,您可以通过添加到上面的命令| grep autoUpgrade来完成。
您可以按照这个答案中解释的那样在日志中验证何时发生这种情况,也可以检查所描述的这里节点池升级状态。为了防止意外发生自动升级并导致工作负载可用性出现上述问题,可以考虑配置维护窗口和排除。在规划维护窗口时,请记住存在其他情况GKE节点需要重新创建.。
您还可以考虑改变喘振升级参数:
浪涌升级允许您一次更改GKE升级的节点数和升级在工作负载上造成的中断量。为每个节点池定义了
max-surge-upgrade和max-unavailable-upgrade标志。有关选择正确参数的更多信息,请转到确定您的最佳浪涌配置。
https://serverfault.com/questions/1063165
复制相似问题