为什么大量分区会影响Kafka集群的性能?管理和监视分区的最佳实践是什么?集群中分区计数的最佳实践是什么?
发布于 2018-06-22 08:01:54
kafka控制器负责跟踪和更新集群中所有代理的集群状态。当分区数量增加时,控制器需要做更多的工作。控制器需要向所有其他代理广播kafka主题元数据信息。更多的分区意味着控制器需要通过网络发送更多的数据。
群集可以承载的分区数取决于群集设置。一个拥有更强大主机的集群将能够托管更多的主题分区。您可以监控集群上的分区数量、代理之间的分区分布以及系统指标(CPU、I/O、网络等)。查看适合您的设置的分区数量。在一台主机上托管超过4000个主题分区后,我们看到了问题。通常,将每个主机的分区副本数量保持在1000以下是一种好的做法。我们还可以检查控制器日志,看看是否有主题元数据更新失败。
https://stackoverflow.com/questions/50975603
复制相似问题