首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据分区的策略

在之前的数据复制当中,我们有一个前提就是数据量不会很大,但是随着公司的发展,再加上埋点等各种数据收集的发展,数据量会爆发式的增长,那么单台服务器很难处理这么庞大的数据了。数据必须分布在各个服务器上,这就是数据分区(partition),在不同的数据系统有着不同的叫法,比如在MongoDB、Elasticsearch、SolrCloud被称为shard,HBase被称为region,Cassandra和Riak被称为vnode,名称虽多但是本质确实一样的。当数据分布在各个服务器时,对性能也会有很大的提高,因为对数据的读取压力会由多台服务器分担。在下面的讨论中,我们会先讨论如何数据分区的方法,再去看看数据热点的rebalancing,最后会讨论如何将请求发送到正确的partition上。

03

MongoDB——基本使用及集群搭建

MongoDB是一种支持多语言面向文档的NOSql数据库,它不支持事务操作(4.2版本开始支持跨文档分布式事务)。什么是面向文档?简单说就是使用类JSON的数据结构——BSON(Binary JSON)来存储数据。使用这种数据结构的好处显而易见,关联信息可以直接内嵌在同一个文档中,不必像关系型数据库那样还需要建立多张表,并建立外键关联,因此大大提升了我们写入数据的效率(前端传回的JSON数据可以直接存入,不必转换为对象),也能灵活的增减字段。如论坛文章,如果用关系型数据库存储,我们需要建立文章表和评论表等,而MongoDB直接存到一个文档里去就可以了,查询也非常方便。

01
领券