如何知道集群的最佳数量--有没有一种方法来评估实际上应该有多少集群？

要确定集群的最佳数量，可以考虑以下几个因素：

负载需求：评估应用程序或服务的负载需求，包括预期的并发用户数、每个用户的请求量、数据处理量等。根据负载需求，可以估算出集群需要处理的工作量。
可用性要求：确定应用程序或服务的可用性要求，包括对故障容忍度和高可用性的需求。如果可用性要求较高，可能需要增加集群的数量以提供冗余和故障恢复能力。
性能目标：根据应用程序或服务的性能目标，例如响应时间、吞吐量等，可以评估出集群的规模。较高的性能目标可能需要更多的集群资源。
成本考虑：考虑集群的数量对成本的影响。增加集群数量会增加硬件、网络和维护成本。需要权衡性能要求和成本之间的平衡。
弹性需求：考虑应用程序或服务的弹性需求，即对资源的动态调整能力。如果应用程序或服务需要根据负载情况进行自动扩展或收缩，可以根据弹性需求来确定集群的最佳数量。

综合考虑以上因素，可以采用以下方法来评估集群的最佳数量：

基准测试：通过模拟实际负载情况进行基准测试，观察集群的性能表现。根据测试结果，可以调整集群的数量以达到性能目标。
负载测试：使用负载测试工具模拟实际用户请求，观察集群的负载情况和性能表现。根据测试结果，可以评估出集群的最佳数量。
监控和分析：使用监控工具对集群的资源使用情况进行实时监控和分析。根据资源利用率和性能指标，可以调整集群的数量以满足需求。
自动化扩展：利用自动化扩展功能，根据负载情况自动增加或减少集群的数量。通过设置合适的扩展策略和阈值，可以实现动态调整集群规模。

需要注意的是，集群的最佳数量是一个动态的过程，随着应用程序或服务的需求变化，可能需要不断地进行评估和调整。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

处理非平衡数据的七个技巧

在这种情况下，可以应用其他评估指标替代，例如：精确率/特异性：多少个选定的实例是相关的。召回率/灵敏度：选择了多少个相关实例。 F1分数：精确率和召回率的加权平衡。...通过保存稀有类（数据量占少数的类别）的所有样本，并在多数类中随机选择相等数量的样本，可以提取出新的平衡的数据集用于进一步建模。过抽样与欠抽样相对，过抽样适用于数据量不足的情况。...如何选用这两种方法取决于应用场合和数据集特点。欠抽样和过抽样相结合也能产生很好的结果。正确使用K重交叉验证值得注意的是，使用过抽样方法来解决不平衡问题时应适当地应用交叉验证。...著名的XGBoost已经是一个很好的起点，如果数据集没有过度倾斜，因为它内部照顾到训练集的平衡性。实际上，数据仍然被重新采样了，只不过是秘密发生的。...总结这不是一个排他性的列表，而是处理不平衡数据的起点。没有适合所有问题的最佳方法或模型。强烈建议你尝试不同的技术和模型来评估哪些方法最有效。尝试创造性地结合不同的方法。

4182 0

必须监控的几个Kubernetes健康指标

监控集群状态并评估由此产生的指标可以让你看到集群总体运行状况的概要视图。你还将了解与节点和 pod 有关的问题。根据状态指标，你可以决定是否需要调查更大的问题或扩展集群。...使用这个指标，你还可以评估节点正在使用的资源数量。你还将看到有多少节点，还有多少节点仍然可用，从而可以准确地知道你所支付的费用以及是否需要调整所使用的节点的数量和大小。...作业失败 Kubernetes Job 是一种控制器，它确保 pod 执行一定的时间，然后一旦它们达到了预期的目的，它们就会退役。...理想情况下，集群中观察到的 DaemonSet 数量应该与所需的 DaemonSet 数量匹配。如果你注意到这些数字不相同，那么至少有一个 DaemonSet 可能失败了。...使用正确的监控策略、Kubernetes 健康指标所关注的知识以及正确的监控工具集，是确保生产环境始终处于启动和运行状态的最佳方法。

5472 0

高级 Kubernetes 部署策略

虽然 Kubernetes 提供了滚动更新作为默认部署策略，但一些用例需要非常规方法来部署或更新集群服务。...通过部署，集群管理员定义应用程序的生命周期，定义应用程序执行相关更新的方式。Kubernetes 部署提供了一种自动化方式来实现和维护集群对象和应用程序所需的状态。...，以及它如何解决持续交付的挑战。...ReplicaSet 的清单（manifest）文件包括以下字段：用于识别属于该集合的 pod 有哪些的选择器（selector）副本数，表示集合中应该有多少个 pod 一个 pod 模板，用于显示新...使用部署进行更新 Kubernetes 部署提供了一种可预测的方法来启动和停止 pod。这些资源让管理人员可以更轻松地迭代和自主部署、回滚更改和管理软件发布周期。

2792 0

Elasticsearch究竟要设置多少分片数？

在与用户讨论这个问题时（会议、论坛形式），引申出的一些最常见的问题是： 1）“我应该有多少个分片？”2）“我的分片应该有多大”？...一个很好的经验法则是：确保每个节点的分片数量保持在低于每1GB堆内存对应集群的分片在20-25之间。...提示：从查询性能角度确定最大分片大小的最佳方法是使用逼真的数据和查询进行基准测试（真实数据而非模拟数据）。...然而，关于如何最好地在索引和分片上分发数据的许多决策将取决于用例细节，有时可能难以确定如何最佳地应用可用的建议。文章提及的几个核心建议清单如下，以回答文章开头的提问。 1） “我应该有多少个分片？...” 答：每个节点的分片数量保持在低于每1GB堆内存对应集群的分片在20-25之间。 2） “我的分片应该有多大”？答：分片大小为50GB通常被界定为适用于各种用例的限制。

5.1K11 0

您的组织真的需要 Kubernetes 吗？

随着服务数量的增长，开发人员必须弄清楚如何有效地管理它们。这包括扩展、部署、网络和容错等任务。云计算和 Openstack 虚拟机 (VM) 是应对这些挑战的早期解决方案之一。...Kubernetes 调度程序可以在集群中高效地分配工作负载，确保每个容器都有足够的资源来有效运行。它还可以根据需求扩展或缩小应用程序，确保最佳的资源使用。...安全性——虽然 Kubernetes 提供了一些内置的安全功能，但它也引入了新的潜在攻击媒介。管理 Kubernetes 集群的安全性需要始终保持警惕并充分了解最佳实践。...评估您的需求了解组织的具体需求和限制是第一步。您想解决什么问题？您正在管理大量微服务吗？您是否正在寻找更好的方法来扩展您的应用程序？您是否遇到很多基础设施可靠性问题？...避免仅仅因为 Kubernetes（或任何技术）是“新的、闪亮的”东西而其他人都在这样做，就采用它是至关重要的。您选择的技术应该有效且高效地满足您的业务需求。

1986 0

推荐一款史上最强大的特征分析可视化工具：yellowbrick

功能雷达 RadViz RadViz雷达图是一种多变量数据可视化算法，它围绕圆周均匀地分布每个特征，并且标准化了每个特征值。一般数据科学家使用此方法来检测类之间的关联。...递归特征消除 Recursive Feature Elimination 递归特征消除（RFE）是一种特征选择方法，它训练模型并删除最弱的特征（或多个特征），直到达到指定数量的特征。...RFE需要保留指定数量的特征，但事先通常不知道有多少特征有效。为了找到最佳数量的特征，交叉验证与RFE一起用于对不同的特征子集进行评分，并选择最佳评分特征集合。...当模型适合8个聚类时，我们可以在图中看到“肘部”，在这种情况下，我们知道它是最佳数字。...根据评分指标调整集群的大小。默认情况下，它们按内部数据的多少，例如属于每个中心的实例数。这给出了集群的相对重要性。但请注意，由于两个聚类在2D空间中重叠，因此并不意味着它们在原始特征空间中重叠。

1.4K2 0

第16篇-关于Elasticsearch的6件不太明显的事情

根据您存储的数据类型，应该以不同的方式对集群建模。对于静态数据，应选择固定数量的索引和分片。它们不会很快增长，并且您始终希望在数据集中的所有文档中进行搜索。...目标是提供最匹配的文档。但是，Elasticsearch实际上如何知道它们是什么？对于每个搜索查询，Elasticsearch都会计算相关性得分。...5.分片规划现在是新手最常问到的Elasticsearch问题。我应该有多少个碎片和索引？为什么会出现这个问题？只能在创建索引的开始就设置分片的数量。因此，答案实际上取决于您拥有的数据集。...为了知道每个索引应该有多少个分片，您可以简单地估算一下，方法是：将多个文档建立索引到一个临时索引中，并查看它们在一段时间内消耗了多少内存，以及您期望在其中拥有多少个内存。...主节点负责集群范围的设置和更改，例如创建或删除索引，添加或删除节点以及向节点分配分片。每个群集至少应包含3个符合主机要求的节点，并且实际上不需要有更多的节点。

2.4K0 0

bilibili技术总监毛剑：B站高可用架构实践

所以，从本质上理解超时它实际就是一种Fail Fast的策略，就是让我们的请求尽可能消耗，类似这种堆积的请求基本上就是丢弃掉或者消耗掉。...A：多集群针对核心（L0）的服务，冗余backend，以及cache等资源，我们通常在PaaS平台针对某个appid的backend支持cluster的概念即隔离多套resource pool或者仅仅是单纯的容器数量翻倍...A：多集群的运维，更多是PaaS平台需要支持，实际上对日常运维感知不强； Q：公司API网关，一般会按照业务系统分吗?还是整个公司就一个API网关？...A：现有的微服务框架，更多是留出Stub，需要你自己来对接QuotaServer，这里更多讲QuotaServer如何更好的实现； Q：过载保护和过负荷保护在实际操作中有区别吗 A：应该没有 Q：有没有重试统计的数据啊...A：数据中心的更多是cache如何一致，可以看看我之前对外的关于分布式缓存的分享； Q：多少人开发的这个系统 A：基础库是零散的owner贡献，core committer也就2-3个； Q：有没有做根据业务重要性来降级的策略

12.1K14 17

yyds，一款特征工程可视化神器！

功能雷达 RadViz RadViz雷达图是一种多变量数据可视化算法，它围绕圆周均匀地分布每个特征，并且标准化了每个特征值。一般数据科学家使用此方法来检测类之间的关联。...** RFE需要保留指定数量的特征，但事先通常不知道有多少特征有效。为了找到最佳数量的特征，交叉验证与RFE一起用于对不同的特征子集进行评分，并选择最佳评分特征集合。...AlphaSelection Visualizer演示了不同的α值如何影响线性模型正则化过程中的模型选择。...当模型适合8个聚类时，我们可以在图中看到“肘部”，在这种情况下，我们知道它是最佳数字。...根据评分指标调整集群的大小。默认情况下，它们按内部数据的多少，例如属于每个中心的实例数。这给出了集群的相对重要性。但请注意，由于两个聚类在2D空间中重叠，因此并不意味着它们在原始特征空间中重叠。

2621 1

压测和性能分析方法论

• 分别知道单机和集群能够承载的性能和拐点 • 单台机器的最大 QPS 是多少？ • 平行扩展后的 QPS 又是多少，是线性增长么?...有了合理的容量规划和评估之后，上线之前去压测系统的时候才能知道我们需要压到什么程度，然后，容量预估并不是拍脑袋的，容量评估需要考虑如下几点： 1....评估整个业务体系下各个模块、子系统的相关指标 5. 评估系统、单机极限 QPS，评估需要多少机器 • 进行压测和数据分析 6....但是针对有状态的存储系统，它能支持的最大并发数不是可以无限扩展的，因此我们一定要能够清楚我们的数据存储层能抗多少量，而针对这种存储集群的压测，一般就是： • 首先针对单机进行压测 • 然后再去分析，集群的整体抗量能力...，需要注意，集群能够承载的量不是单机的累加值，一般在集群中每增加一台机器，可以采用 80% 递减的方式来粗略评估。

1.2K2 0

Elasticsearch集群规划及节点角色规划醉佳实践

集群发生故障再恢复平衡的速度取决于分片的大小、分片数量、网络以及磁盘性能。在 Elasticsearch 中，每个查询在每个分片的单个线程中执行。但是，可以并行处理多个分片。...3.2 分片数设定选择正确数量的分片是一个复杂问题，因为在集群规划阶段以及在数据写入开始之前，一般不能确切知道文档数。...推荐1：Elasticsearch究竟要设置多少分片数？...主节点职责：存储集群状态信息、分片分配管理等。同时注意，Elasticsearch 应该有多个候选主节点，以避免脑裂问题。 6.2 数据节点数据节点职责：CURD、搜索以及聚合相关的操作。...应根据引起磁盘 IO 的情况评估对策，常见优化磁盘 IO 实战策略如下：优化分片数量及其大小段合并策略优化更换普通磁盘为SSD磁盘添加更多节点 7.5 合理设置预警对于依赖搜索的应用程序，用户体验与搜索请求的等待时间长短相关

9433 0

通过局部聚集自适应的解开小世界网络的纠结

一种不同的一般方法是在图中识别集群，然后使用这些集群来可视化网络6、7。这种方法将可视化问题转移到集群或社区检测方法的选择上。...我们的贡献是: 一种新颖的方法来量化每一个阈值对主干的组结构的影响。...(e)过滤删除了越来越多的集群边缘，破坏了组的相对位置。更准确地说，我们使用phi系数作为一种相似性度量来评估聚类系数的有效性。...考虑到时间复杂度O()远小于n=|V|,目前尚不清楚如何在聚集系数为n(最坏的情况下)时更新删除下一个边缘的数量可以在O()时间内执行完毕。...为了计算一个图的聚类系数,我们只需要知道每个顶点的三角形数量,时间复杂度为O(α(G)m),α(G)是图的荫度,或是图g所需的能覆盖所有的边的最小生成森林。

1K1 0

详解DBSCAN聚类

K-Means只能应用球形簇，如果数据不是球形的，它的准确性就会受到影响。最后，KMeans要求我们首先选择希望找到的集群的数量。下面是KMeans和DBSCAN如何聚类同一个数据集的示例。 ?...另一方面，DBSCAN不要求我们指定集群的数量，避免了异常值，并且在任意形状和大小的集群中工作得非常好。它没有质心，聚类簇是通过将相邻的点连接在一起的过程形成的。 DBSCAN是如何实现的呢?...选择一个新的随机点，并重复该过程以识别下一个簇。 ? 如何确定最优的Epsilon值估计最优值的一种方法是使用k近邻算法。...现在我们知道了维持一个特定百分比的方差所需的主成分的数量，让我们对原始数据集应用一个3成分的主成分分析。请注意，第一个主成分占到与原始数据集方差的26%。...接下来，我们尝试了一种迭代的方法来微调epsilon和minPts。我们已经确定了epsilon值为1.0和minPts值为4。

1.7K1 0

测试数据科学家聚类技术的40个问题（附答案和分析）

但是可以根据K聚类分析的结果来创建一个簇状图。 Q12. 如何使用聚类（无监督学习）来提高线性回归模型（监督学习）的准确性：为不同的集群组创建不同的模型。...根据下图，水平线贯穿过的树状图中垂直线的数量将是簇数的最佳选择，这条线保证了垂直横穿最大距离并且不与簇相交。在上面的例子中，簇的数量最佳选择是4，因为红色水平线涵盖了最大的垂直距离AB。 Q16....质心方法通过计算集群的质心之间的距离来计算两个簇的接近度。对于 Ward 方法来说，两个簇的接近度指的是当两个簇合并时产生的平方误差的增量。...而且，初始化不良会降低收敛的速度差并会使得整体聚集效果不佳。 Q32. 可以用下面哪一种方法来获得和全局最小值有关的K均值算法的良好结果？...集群中的数据点必须处于到核心点的距离阈限内它对数据空间中数据点的分布有很强的假设它具有相当高的时间复杂度O(n3) 它不需要预先知道期望出现的簇的数量它对于异常值具有强大的作用选项： 1 2 4

1.1K10 0

白瑜庆：知乎基于Kubernetes的kafka平台的设计和实现

另外集群内部有超过一千个topic，我们有接近两千的Broker数量。平台从上线到现在已经运行接近两年，承载的数据量都是百TB级别。对于公司内部的平台来说，我们必须要保证高可用。...图片4.png 另外网络方面就是我们对外服务，采用的是一种独立的内网ip方式，比如我每一个Broker都有一个独立的ip，实际上因为我们的单机上会部署很多容器，所以每个都有IP，并且将这个ip注册在内网...其实它用了一个简单的方式，假设创建一个红色集群，实际上A和C都可以，但C是最优的，因为C上面的Broker数比较少。如果要创建一个蓝色集群，那显然是A是最优的。...想问一下有没有什么隔离的好的办法？你一个集群里有多少套？集群里有多个topic，数据我就不想让别人看到吗？当然我如果提供一个客户端给他，他就能把所有的数据看得到，有没有什么好的办法。...A：其实是这样的，就是在我们的一个情况称，如果这个进群它有多少Broker，假如在这个会相互影响，我们还是建议把它不是相互影响，因为集群面不可能只给一个用户只提供一个集群，就是我们一个大的集群，会有很多用户在使用他的数据

2.5K11 0

全新instruction调优，零样本性能超越小样本，谷歌1370亿参数新模型比GPT-3更强

本文中，Quoc Le 等来自谷歌的研究者探索了一种简单的方法来提高大型语言模型在零样本情况下的性能，从而扩大受众范围。...为了评估 FLAN 在未知任务上的零样本性能，该研究根据 NLP 任务的任务类型将其分为多个集群，并对每个集群进行评估，同时在其他集群上对 FLAN 进行指令调整。...在消融研究中，研究发现在指令调整中增加任务集群的数量，可以提高模型在未见过的任务的性能，并且指令调整的好处只有在模型规模足够大的情况下才会出现。...为了评估模型在未见过的任务上的性能，该研究按照任务类型将任务分成多个集群，当其他集群进行指令调整时，留出一个任务集群进行评估。...其他实验由于该论文的核心问题是指令调整如何提高模型在未见过任务上的零样本性能，因此该研究的第一个消融实验研究了指令调整中使用的集群和任务数量对性能的影响。图 5 显示了实验结果。

2601 0

HBase调优及优化的20种方式(上)

如果来评估HBase的集群规模? 首先需要了解应用场景是什么样子的,是一种读更加密集的还是写更加频繁的?因为它涉及到很多方面的考虑....其次评估好负载情况,区分为读取/写入的负载使用以及预估到的使用模式对于SLA的要求是什么,如何来量化读写延迟,以及能够对数据的不一致性的容忍程度达到多少?...然后是存储,评估好每天的数据增量是多少,是否要设置好TTL?...那么如果region数量很多,就会生成很多的storefile文件小文件,小文件问题就不再多说了,其次就是会触发hbase的文件合并操作,从而保证HFile的数量在一个合理的范围内,合并操作会造成集群的不稳定...检索时，我们只要看看这些点是不是都是1就（大约）知道集合中有没有它了：如果这些点有任何一个0，则被检元素一定不在；如果都是1，则被检元素很可能在 Bloomfilter根据key随机读时，在StoreFile

2K2 0

看图轻松了解etcd

用一些图示结合场景和文字轻松了解etcd，文章是针对etcd初学者的，目的是让大家了解etcd是什么、主要在什么场景下使用、etcd集群是怎么工作的以及创建集群时应该如何选择集群的节点数。...关于节点数的最佳实践 ?...关于如何确定etcd集群应该有多少个节点的问题，上图的左侧的图表给出了集群中节点总数(Instances)对应的Quorum数量，用Instances减去Quorom就是集群中容错节点（允许出故障的节点...所以在集群中推荐的最少节点数量是3个，因为1和2个节点的容错节点数都是0，一旦有一个节点宕掉整个集群就不能正常工作了。...当决定集群中节点的数量时，强烈推荐奇数数量的节点，比如下图表中高亮的那几个选项。 ?

8911 0

FAQ系列之Kafka

获取有关可以在 Kafka Java 代码中调用哪些功能的更多信息的最佳方法是查看 Java 文档。并且仔细阅读！如果我关心性能和稳定性，最好的 Kafka 记录大小是多少？...或者：主题的“正确”分区数是多少？为主题选择合适的分区数量是实现读写高度并行和分配负载的关键。在分区上均匀分布负载是获得良好吞吐量（避免热点）的关键因素。...如何将消费者偏移重置为任意值？这也是使用kafka-consumer-groups命令行工具完成的。这通常是一种管理功能，用于绕过损坏的记录、数据丢失或从代理或主机的故障中恢复。...心跳超时：新的消费者有一个“心跳线程”，它向代理（实际上是代理中的组协调器）发出心跳，让代理知道消费者还活着。这种情况定期发生，如果代理在超时期限内未收到至少一个心跳，则假定消费者已死亡并断开连接。...还请记住，您将对 Kafka 的数据使用 RAID10，因此您的一半硬盘将用于冗余。从那里，您可以计算需要多少驱动器。通常，您希望拥有比驱动器数量建议的最少数量更多的主机。

9483 0

Elasticsearch 生产环境集群部署最佳实践

在生产环境搭建或维护 Elasticsearch 集群和个人搭建集群的小打小闹有非常大的不同。本文的最佳实践基于每天增量数亿+ 的线上环境。少啰嗦，上干货。...集群发生故障再恢复平衡的速度取决于分片的大小、分片数量、网络以及磁盘性能。在 Elasticsearch 中，每个查询在每个分片的单个线程中执行。但是，可以并行处理多个分片。...3.2 分片数设定选择正确数量的分片是一个复杂问题，因为在集群规划阶段以及在数据写入开始之前，一般不能确切知道文档数。...主节点职责：存储集群状态信息、分片分配管理等。同时注意，Elasticsearch 应该有多个候选主节点，以避免脑裂问题。 6.2 数据节点数据节点职责：CURD、搜索以及聚合相关的操作。...应根据引起磁盘 IO 的情况评估对策，常见优化磁盘 IO 实战策略如下：优化分片数量及其大小段合并策略优化更换普通磁盘为SSD磁盘添加更多节点 7.5 合理设置预警对于依赖搜索的应用程序，用户体验与搜索请求的等待时间长短相关

2.5K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云