每个节点可以有不同的集群视图。没有集中化监视节点。为了追踪问题的来源,您必须独立监控每个节点。
许多变量的值取决于您查询的节点。例如,从节点发送的复制和由所有其他节点接收的写入。
从所有节点获取数据可以帮助您了解流消息的来源,哪个节点发送过大的事务,等等。
手动集群监控可以使用myq-tools来执行 。
除了标准的MySQL警报之外,您至少应该使用以下特定于Percona XtraDB集群的触发器:
每个节点的集群状态 wsrep_cluster_status !=Primary Primary节点状态 wsrep_connected != ON wsrep_ready != ON
有关其他警报,请考虑以下状态变量: 过大的复制冲突: wsrep_local_cert_failures wsrep_local_bf_aborts
过多的流量控制消息 wsrep_flow_control_sent wsrep_flow_control_recv
大复制队列 wsrep_local_recv_queue。
用于长期制图的集群度量收集应至少针对以下内容进行:
队列大小: wsrep_local_recv_queue wsrep_local_send_queue
流量控制: wsrep_flow_control_sent wsrep_flow_control_recv
节点的事务数量: wsrep_replicated wsrep_received
以字节为单位的事务数量: wsrep_replicated_bytes wsrep_received_bytes
复制冲突: wsrep_local_cert_failures wsrep_local_bf_aborts
https://www.percona.com/doc/percona-xtradb-cluster/LATEST/manual/monitoring.html