基本概念及原理
MongoDB 是一个基于分布式文件存储的数据库。由 C++语言编写。旨在为 WEB 应用提供可 扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数据库和非关系数据库之间的 产品,是非关系数据库当中功能最丰富,最像关系数据库的。
什么是NoSQL
NoSQL,指的是非关系型的数据库。NoSQL 有时也称作 Not Only SQL 的缩写,是对不同于传 统的关系型数据库的数据库管理系统的统称。NoSQL 用于超大规模数据的存储。(例如谷歌 或 Facebook 每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的 模式,无需多余操作就可以横向扩展
关系型数据库 PK 非关系型数据库
NoSQL数据库分类
CAP 原则
在计算机科学中, CAP 定理(CAP theorem), 又被称作 布鲁尔定理(Brewer's theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
一致性(Consistency) (所有节点在同一时间具有相同的数据)
可用性(Availability) (保证每个请求不管成功或者失败都有响应)
分区容错性(Partition tolerance) (系统中任意信息的丢失或失败不影响系统的继续运行)
CAP 理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。 因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类:
CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
CP - 满足一致性,分区容错性的系统,通常性能不是特别高。
AP - 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。 MongoDB默认就是满足Ap的,弱事务性。
MongoDB的数据结构与关系型数据库数据结构对比
MongoDB 中的数据类型
MongoDB 的集群部署
MongoDB 的集群部署方案中有三类角色:实际数据存储结点、配置文件存储结点和路由接入结点。连接的客户端直接与路由结点相连,从配置结点上查询数据,根据查询结果到实际的存储结
点上查询和存储数据。MongoDB 的部署方案有单机部署、复本集(主备)部署、分片部署、复本集与分片混合部署。
路由结点:路由角色的结点在分片的情况下起到负载均衡的作用。
配置结点:存储配置文件的服务器其实存储的是片键与 chunk 以及 chunk 与 server 的映射关系。
混合的部署方式
复本集
对于复本集,又有主和从两种角色,写数据和读数据也是不同,写数据的过程是只写到主结点中,由主结点以异步的方式同步到从结点中。而读数据则只要从任一结点中读取,具体到哪个结点读取是可以指定的。
MongoDB的应用场景和不适用场景
1、适用场景
对于 MongoDB 实际应用来讲,是否使用 MongoDB 需要根据项目的特定特点进行一一甄别,
这就要求我们对 MongoDB 适用和不适用的场景有一定的了解。
根据 MongoDB 官网的说明,MongoDB 的适用场景如下:
1)网站实时数据:MongoDB 非常适合实时的插入,更新与查询,并具备网站实时数据存储
所需的复制及高度伸缩性。
2)数据缓存:由于性能很高,MongoDB 也适合作为信息基础设施的缓存层。在系统重启之
后,由 MongoDB 搭建的持久化缓存层可以避免下层的数据源过载。
3)大尺寸、低价值数据存储:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在
此之前,很多时候程序员往往会选择传统的文件进行存储。
4)高伸缩性场景:MongoDB 非常适合由数十或数百台服务器组成的数据库。MongoDB 的路
线图中已经包含对 MapReduce 引擎的内置支持。
5)对象或 JSON 数据存储:MongoDB 的 BSON 数据格式非常适合文档化格式的存储及查询。
2、不适用场景
了解了 MongoDB 适用场景之后,还需要了解哪些场景下不适合使用 MongoDB,具体如下:
1)高度事务性系统:例如银行或会计系统。传统的关系型数据库目前还是更适用于需要
大量原子性复杂事务的应用程序。
2)传统的商业智能应用:针对特定问题的 BI 数据库会对产生高度优化的查询方式。对
于此类应用,数据仓库可能是更合适的选择。
3)需要复杂 SQL 查询的问题。
相信通过上面的说明,你已经大致了解了 MongoDB 的使用规则,需要说明一点的是,
MongoDB 不仅仅是数据库,更多的使用是将 MongoDB 作为一个数据库中间件在实际应用中
合理划分使用细节,这一点对于 MongoDB 应用来讲至关重要!