这个错误可能会在 show backends 或 show frontends 命令的结果中出现。通常出现在某个 FE 或 BE 节点的错误信息列中。这个错误的含义是,Master FE 向这个节点发送心跳信息后,该节点发现心跳信息中携带的 cluster id 和本地存储的 cluster id 不同,所以拒绝回应心跳。 Doris 的 Master FE 节点会主动发送心跳给各个 FE 或 BE 节点,并且在心跳信息中会携带一个 cluster_id。cluster_id 是在一个集群初始化时,由 Master FE 生成的唯一集群标识。当 FE 或 BE 第一次收到心跳信息后,则会将 cluster_id 以文件的形式保存在本地。FE 的该文件在元数据目录的 image/目录下,BE 则在所有数据目录下都有一个 cluster_id 文件。之后,每次节点收到心跳后,都会用本地 cluster_id 的内容和心跳中的内容作比对,如果不一致,则拒绝响应心跳。 该机制是一个节点认证机制,以防止接收到集群外的节点发送来的错误的心跳信息。 如果需要恢复这个错误。首先要先确认所有节点是否都是正确的集群中的节点。之后,对于 FE 节点,可以尝试修改元数据目录下的 image/VERSION 文件中的 cluster_id 值后重启 FE。对于 BE 节点,则可以删除所有数据目录下的 cluster_id 文件后重启 BE。