首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >全新的卡桑德拉,在理解复制拓扑方面有困难。

全新的卡桑德拉,在理解复制拓扑方面有困难。
EN

Stack Overflow用户
提问于 2014-11-13 17:25:17
回答 2查看 87关注 0票数 2

所以,在前一位管理员离开后,我接管了卡桑德拉星系团,所以我正忙着尽可能多地了解它。当我们使用Datastax的产品时,我正在查看Datastax网站上的所有文档。

尽管如此,在复制因子部分,我有点难以理解为什么不将复制因子设置为我拥有的节点数。我目前有四个节点和一个数据中心,所有节点都位于同一个物理位置。

如果有的话,复制系数小于4会有什么好处呢?

我只是在想,从容错的角度来看,如果每个节点都有自己的数据副本/副本,我不知道为什么我想要的副本比我拥有的节点数量少。是否存在性能权衡或其他原因?我是否完全忽略了这个概念(完全可能)?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-11-13 17:58:19

您可能不想将RF从3增加到4的原因有几个:

  1. 增加你的射频有效地使你原来的数据量乘以这个数量。根据您的数据量和数据密度,您可能不希望遭受额外的存储攻击。RF >节点的数量将帮助您扩展到超出一个节点的容量。
  2. 根据您的一致性水平,您可能会体验到性能的冲击。也就是说,当将仲裁一致性级别(CL)写入RF为3时,在确认对客户端的写入之前,您需要等待2个节点返回。在RF 4中,您将等待3个节点返回。
  3. 不管CL是什么,每一次写入最终都会到达每个节点。这在您的集群中是更多的活动,如果您的节点没有针对该工作负载进行缩放,它的性能可能不会很好。

你提到了容错。使用RF为4,并在CL 1上读取,您可以吸收多达3台服务器同时关机,您的应用程序仍将启动。从容错的角度来看,这是相当令人印象深刻的,但也不太可能。我猜如果在同一个dc中同时有3个节点下降,那么第4个节点可能也会下降(自然灾害,洪水,谁知道.)。

最后,这一切都取决于您的需求和C*是什么,如果不是可配置的。在Cassandra实现中,RF为3非常常见。

看看朱乔的这张牌

票数 2
EN

Stack Overflow用户

发布于 2014-11-13 18:01:22

您的RF通常少于集群中节点数的原因在post:卡桑德拉列族比节点驱动空间大中得到了解释。这篇文章提供了对卡桑德拉复制这个有趣方面的洞察力。下面是这篇文章的摘要:

问题:。。。每个节点都有2Tb的驱动空间,并且列族被复制到每个节点上,因此每个节点都包含一个完整的副本。。。几年后,这个专栏家族将超过2Tb。。。 答: RF可以小于节点数,如果添加更多节点,则不需要缩放。 例如,如果您今天有3个具有RF 3的节点,那么正如您所说的,每个节点将包含所有数据的副本。但是,如果再添加3个节点,并将RF保持在3,则每个节点将有一半的数据。您可以继续添加更多的节点,以便每个节点包含的数据比例越来越小。。。原则上没有限制你的数据可以有多大。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26914753

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档