专栏首页数据和云循序渐进:Oracle 12.2的Sharding基础概念解读

循序渐进:Oracle 12.2的Sharding基础概念解读

张大朋(Lunar)Oracle 工程师

Lunar 拥有超过十年的 ORACLE SUPPORT 从业经验,曾经服务于ORACLE ACS部门,现就职于 ORACLE Sales Consultant 部门,负责的产品主要是 Exadata,Golden Gate,Database 等。

2015年8月份内部release了Oracle 12.2 Beta版本(目前内部最新release的版本是2016年2月份发布的,windows和Linux都有了),目前根据12.2beta文档的介绍,Oracle推出了sharding的功能,跟其他NOSQL型的sharding结构相比,Oracle Sharding提供的是企业级的RDBMS的分片技术。

Oracle Sharding的优点: • Relational schemas • Database partitioning • ACID properties and read consistency • SQL and other programmatic interfaces • Complex data types • Online schema changes • Multi-core scalability • Advanced security • Compression • High Availability features • Enterprise-scale backup and recovery 在Oracle RDBMS 12.2.0.1中最多支持1000个shards。 Oracle Sharding使用GDS(Global Data Services)架构来自动部署和管理sharding和复制技术。GDS(GDS是Oracle RDBMS 12.1的新特性)也提供负载均衡和SDB(sharded database)中的基于位置的路由功能。

Shard目录(Shard directors)使用GDS framework的全局服务管理组件(global service manager component)来提供应用层请求到shard的直接路由。shard目录(Shard directors)是一个单独的数据库,它用来保存SDB(Sharding database)配置数据和提供其他相关功能,比如shard的交叉查询和集中管理。可以使用GDS是GDSCTL工具可以用来配置SDB。

Oracle Sharding的分区架构(Partitioning Infrastructure) 分区在表空间级别跨Shards分布,每个表空间关联一个特定的shard。一个shard表的每一个分区放单独的表空间,并且每个表空间关联到一个特定的shard。根据不同的sharding方法,这个关联可以自动建立或者根据定义创建。尽管一个shard表的多个分区放在多个单独主机的数据库上(这些数据库完全独立,不共享CPU、内存等软件和硬件),但是应用访问表时就如同访问一个单独数据库中的分区表一样。应用发出的SQL语句不需要依赖shard号和shard的物理配置。 Oracle Sharding 使用 familiar SQL 语法创建表分区,指定分区表的每行数据如何分片。 一个shard表的分区键叫做sharding key,例如,下面的语法是典型的用来创建sharding表的: CREATE SHARDED TABLE customers ( cust_id NUMBER NOT NULL , name VARCHAR2(50) , address VARCHAR2(250) , region VARCHAR2(20) , class VARCHAR2(3) , signup DATE CONSTRAINT cust_pk PRIMARY KEY(cust_id) ) PARTITION BY CONSISTENT HASH (cust_id) TABLESPACE SET ts1 PARTITIONS AUTO; 这个数据分片(shard)就是基于键值cust_id,分区采用“CONSISTENT HASH”,这是一个特定的hash分区类型,通常用在分布式系统上。

. Sharding a Table Family 一个表家族(Table Family)中没有任何父表的表叫做根表(root table),每个表家族中只能有一个根表。 表家族中所有的表按照根表的主键进行sharding,根据各级表的结构,相关数据可以被存储在同一个shard上。 在12.2,在一个SDB中只支持一个表家族。 . 以下面的例子说明,这里一共3张表组成的表家族(Table Family):客户表,订单表和订单明细表。 每个客户可以有多个订单,每个订单中可以有多个商品,因此订单明细中就记录了每个订单中的多个商品,他们的具体数据如下:



在这个表族中,客户编号为123的数据如下:



将一个表族(Sharded Table Family)分片通常使有下面两种方法创建方法1:不显示指定父子关系,而是通过表之间主外键关系创建表族。

这种方式创建的表族是一个多级的树形结构。 根表(root table)是客户表: –客户表的主键是CustNo,分区方式是“CONSISTENT HASH (CustNo)” –保存再表空间集ts1中

CREATE SHARDED TABLE Customers( CustNo NUMBER NOT NULL, Name VARCHAR2(50), Address VARCHAR2(250), CONSTRAINT RootPK PRIMARY KEY(CustNo))PARTITION BY CONSISTENT HASH (CustNo)PARTITIONS AUTOTABLESPACE SET ts1;

–订单表是客户表的字表,子表(订单表)根据CustNo关联父表(客户表): –订单表的主键是(CustNo, OrderNo),外键(CustNo)引用了主表Customers(CustNo) –分区方式是按照订单表的外键约束(CustFK)

CREATE SHARDED TABLE Orders( OrderNo NUMBER NOT NULL, CustNo NUMBER NOT NULL, OrderDate DATE, CONSTRAINT OrderPK PRIMARY KEY (CustNo, OrderNo), CONSTRAINT CustFK FOREIGN KEY (CustNo) REFERENCES Customers(CustNo))PARTITION BY REFERENCE (CustFK);

–订单明细表是订单表的字表,子表(订单明细表)根据CustNo关联父表(订单表) –订单明细表的主键是(CustNo, OrderNo, LineNo),外键(CustNo, OrderNo)引用了父表Orders(OrderNo)和Orders(CustNo, OrderNo) –分区方式是按照订单明细表的外键约束(LineFK)

CREATE SHARDED TABLE LineItems( CustNo NUMBER NOT NULL, LineNo NUMBER(2) NOT NULL, OrderNo NUMBER(5) NOT NULL, StockNo NUMBER(4), Quantity NUMBER(2), CONSTRAINT LinePK PRIMARY KEY (CustNo, OrderNo, LineNo), CONSTRAINT LineFK FOREIGN KEY (CustNo, OrderNo) REFERENCES Orders(OrderNo) REFERENCES Orders(CustNo, OrderNo))PARTITION BY REFERENCE (LineFK);

因此,上面的例子中,这个表家族的所有数据都保存在同一个表空间集ts1中。 当根表中增加一个分区的时候,那么相关联的表中都会自动增加相应的分区。

. 方法2:在分区表中显示指定父子关系的方法创建表家族 这种分区方法只支持两级的表家族(two-level table families),所有的子表必须有相同的父表,父表的分区列在每个子表中都存在,例如下面的CustNo. . –没有关键字“PARENT”(也没有上面引用约束关键字)的是根表,即客户表(Customers)

CREATE SHARDED TABLE Customers( CustNo NUMBER NOT NULL, Name VARCHAR2(50), Address VARCHAR2(250), region VARCHAR2(20), class VARCHAR2(3), signup DATE)PARTITION BY CONSISTENT HASH (CustNo)TABLESPACE SET ts1PARTITIONS AUTO;

–根据关键字“PARENT Customers”指定了订单表(Orders)的父表是客户表(Customers)

CREATE SHARDED TABLE Orders( OrderNo NUMBER, CustNo NUMBER, OrderDate DATE)PARENT CustomersPARTITION BY CONSISTENT HASH (CustNo)TABLESPACE SET ts1PARTITIONS AUTO;

–根据关键字“PARENT Customers”指定了订单明细表(LineItems)的父表是客户表(Customers)

CREATE SHARDED TABLE LineItems( LineNo NUMBER, OrderNo NUMBER, CustNo NUMBER, StockNo NUMBER, Quantity NUMBER))PARENT CustomersPARTITION BY CONSISTENT HASH (CustNo)TABLESPACE SET ts1PARTITIONS AUTO;

Creating a Duplicated Table Using CREATE TABLE 复制表可以被复制到所有的shard上,这种在每个shard上有相同内容的表叫做复制表(Duplicated Table),需要经常跟shard表关联的小表适合于作为复制表(Duplicated Table),适用于: (1)只读表 (2)大量跨shard的读操作 Oracle Sharding使用Materialized View Replication来同步复制表(duplicated tables)的内容,每个shard上的duplicated tables的内容是一个只读物化视图(read-only materialized view)。

物化视图(materialized views)的主表保存在一个专门的数据库中,叫做Shard Catalog。 所有shard上的物化视图(materialized views)会根据配置的频率自动刷新。 创建复制表的语句“CREATE DUPLICATED TABLE”会自动创建master表,物化视图和其他物化视图复制所需要的对象。 还是以上面的客户订单关系为例,这里定义产品表(Products)为复制表:



CREATE DUPLICATED TABLE Products( StockNo NUMBER PRIMARY KEY, Description VARCHAR2(20), Price NUMBER(6,2)));

根据sharding的机制,sharding的设计对后续系统性能影响是非常大的。一旦sharding创建完成,并已经有很多数据,相关的属性就不能再修改了,比如某个表是复制表,还是sharding表,sharding key等等,因此,SDB的设计是至关重要的,在设计sharding时需要考虑的有:

哪些表需要被设计为sharding表; 哪些表需要做复制表; 哪些shard表是根表; 使用什么方法来关联一个表到其他表或者根表; 应该使用哪种sharding方法; 使用哪个作为sharding key;

本文分享自微信公众号 - 数据和云(OraNews),作者:张大朋

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-05-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 性能优化:Linux环境下合理配置大内存页

    熊军(老熊) 云和恩墨西区总经理 Oracle ACED,ACOUG核心会员 PC Server发展到今天,在性能方面有着长足的进步。64位的CPU在数年前都已...

    数据和云
  • 那些被你忽略的性能 - Oracle Redo的产生场景及优化

    ? 冷菠 冷菠,资深DBA,著有《Oracle高性能自动化运维》,有近10年的数据库运维、团队管理以及培训经验。擅长数据库备份恢复、数据库性能诊断优化以及数据...

    数据和云
  • 深入剖析:优化,要从根源开始

    作者简介 ? 今天与大家分享一则表结构设置不合理引发故障的案例。 案例说明 这是某公司后台的ERP系统,系统已经上线运行了10多年。随着时间的推移,累积的数据...

    数据和云
  • IoT上的缓冲区溢出漏洞

    在过去N年里,缓冲区溢出一直是网络攻击中最常被利用的漏洞。 看一下缓冲区是如何创建的,就能知道原因所在。

    半吊子全栈工匠
  • 微人事如何像 QQ 一样实现登录互踢?松哥手把手教大家

    这是一篇旧文,之前有小伙伴反映文章没太看懂,因此松哥又录制了一个视频教程,手把手教大家实现微人事登录互踢功能(用户在新设备登录成功之后,会自动踢掉之前的登录)。

    江南一点雨
  • Redis专题(五)——Redis数据持久化

    Redis专题(五)——Redis数据持久化 (原创内容,转载请注明来源,谢谢) 当服务器突然发生问题,或者redis重启,如果希望将数据持久化在硬盘中,下次...

    用户1327360
  • 开发理念和用户体验

    要有追求美的意识,简就是美。要形成自己的思想,设计需要灵魂。模式模式有时是恶魔,它容易让你走上抄袭模仿之路。把职责单一作为第一原则,并努力遵守,将让你柳暗花明又...

    一见
  • es 5 数组reduce方法记忆

    reduce() 方法接收一个函数作为累加器(accumulator),数组中的每个值(从左到右)开始合并,最终为一个值。 概念:对数组中的所有元素调用指定的回...

    蓓蕾心晴
  • 人脸识别中Softmax-based Loss的演化史

    近期,人脸识别研究领域的主要进展之一集中在了 Softmax Loss 的改进之上;在本文中,旷视研究院(上海)(MEGVII Research Shangha...

    算法工程师之路
  • 泛广电领域的卫星传输和公网传输

    大家好,我是来自安徽广播电视台的张博力,接下来我将为大家详细介绍泛广电领域的卫星传输和公网传输。

    LiveVideoStack

扫码关注云+社区

领取腾讯云代金券