来自我们的收集器对的联邦超过了联邦的60次扫描间隔,~59秒基于scrape_duration_seconds{job=“联邦”}
--我们在数据中心内的设置--两个收集器分别指向所有服务器(~1,500)和一个从两个收集器中的一个收集的联合服务器。收集器间隔为30,联邦服务器为60。对于我们有问题的数据中心,大约有80万个度量标准。联邦服务器正在运行6 6proc、16 is ram和1.6.2版本。我们的设计假设每个数据中心都有一个联合服务器(用于1.N环境),由多个收集器对组成联邦。是否有更好的设计