分布式数据库

文字 关注我们吧!

分布数据库定义:分布数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自洽),可以执行局部应用。同时每个结点也能通过网络通信子系统执行全局应用。

分布式数据库目标:

本地自治、非集中式管理、高可用性(最基本的特征)

位置独立性、数据分片独立性、数据复制独立性(分布透明性)

分布独立性、事务管理(复杂性)

硬件独立性、操作系统独立性、网络独立性、数据库管理独立性(独立性)

数据分布策略:

数据分片(对关系操作)和数据分配(对分片结果)考虑

数据分片:

垂直、水平、导出、混合

数据分配:将分片产生的片段分配存储在各个场地上(物理存储)解决数据分配的方法:

集中式:所有的数据片段安排在一个场地上

分割式:所有全局数据有且只有一份分割成若干被分配在特定场地上的片段

全复制式:全局数据由多个副本,每一个场地上有一个完整的数据副本

混合式:介于分割与全复制式之间

分布式透明性:

分片透明性:用户无需考虑数据分片

位置透明性:用户只需考虑数据分片情况,无需考虑数据分片位置

局部数据模型透明性:既要了解全局数据的分片情况,还要了解各片段的副本复制

情况及位置分配情况

分布式查询:

用户与分布式数据库系统的接口。分布查询优化需考虑:

(1)操作执行的顺序。

(2)操作的执行算法(连接操作和并操作)

(3)不同场地间的数据流动的顺序。

数据独立性:在集中式数据库中,数据独立性包括两个方面:数据逻辑独立性和数据的物理独立性。通过系统的三级模式(外模式、模式、内模式)和它们之间的二级映像得到的。

集中式数据库系统中查询代价主要是由CPU代价和I/O代价来衡量的

在分布式数据库系统中,由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点处传输数据的通信代价

END

本文分享自微信公众号 - ellipse数据库技术(ellipse16)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券