作者介绍:
曾令军,云和恩墨技术专家,2009年开始接触ORACLE数据库,8年数据库运维经验。思维敏捷,擅长于数据库开发、解决棘手的数据库故障和性能问题。服务于公司华南区多个客户,曾参与过国内多家股份制银行、城市商业银行的核心业务系统、数据仓库的部署建设和生产运维工作,在数据库故障诊断、运维监控、性能优化方面积累了丰富的经验。
什么是在线重定义
要了解什么是在线重定义技术,我想从表分区开始说起。在生产系统运维过程中,经常遇到的一个需求是如何把一个数据量非常大的普通表改造成分区表。分区最早在oracle8.0版本引入,支持将一个表或索引物理地分解为多个更小、更可管理的部分。
好处:
分区表在各行业的数据库都得到广泛应用,但是有些业务系统在设计阶段对系统数据和性能容量增长估计不足,或没有考虑到运维过程中的数据归档需求,往往没有对表做分区设计。在生产运行经过长时间的数据积累之后,才发现表越来越大,某些查询或插入数据的性能变得越来越慢,迫切需要做表分区改造。
那么问题来了,业务系统往往都是7*24在线作业,改造的过程又必然涉及表结构的变动,如果对表进行重建,会对系统运行产生非常大的影响,通常会设置计划停机窗口来做这类维护操作。
当然,分区表的改造只是诸多数据重组织或重定义场景中的一种,在数据变动需求越来越多、越来越复杂,而系统停机的成本又显著升高的背景下,从Oracle 8i开始就设计了有限的在线重新组织数据的功能,例如create indexes online, rebuilding indexes online。并在9i进一步扩展这方面的能力,引入了数据在线重定义。
在线重定义技术允许数据库管理员在该表上有读写数据操作的情况下,非常灵活地修改表的物理属性、表数据、表结构。
在线重定义的使用场景
有以下变更需求时,都可以考虑使用在线重定义技术,这些场景也是运维过程中经常遇到的:
在线重定义的实现原理
ORACLE提供了一个DBMS_REDEFINITION包用于在线重定义操作,主要包含三个过程:
DBMS_REDEFINITION.START_REDEF_TABLE
这个过程首先会创建一个快速刷新的物化视图作为过渡表,然后将源表的数据加载到过渡表中,并在源表上创建物化视图日志,以支持快速刷新同步数据
DBMS_REDEFINITION.SYNC_INTERIM_TABLE
用来把源表中的数据同步到过渡表
DBMS_REDEFINITION.FINISH_REDEF_TABLE
这个过程的操作步骤比较多,也是做在线重定义时需要特别注意的,但其执行时间通常是非常短的:
1)先调用一次DBMS_REDEFINITION.SYNC_INTERIM_TABLE,同步数据
2)锁定源表,锁定之后表数据不再允许发生变化
3)再调用一次DBMS_REDEFINITION.SYNC_INTERIM_TABLE,同步数据
4)交换源表和过渡表的表名
5)删除物化视图和物化视图日志
6)释放表锁资源
将普通表改造成分区表
下面我们通过实际案例来应用这项技术,本次实践中我们要弄清楚几个问题:
1检查用户权限
运行DBMS_REDEFINITION包需要以下权限:
可进入用户后执行以下SQL进行检查确认:
select * from session_privs;
2模拟创建一个源表,并插入测试数据
3模拟业务发生场景,一直持续到所有操作结束
按查询更新插入比例为7:1:2模拟,TPS为10,即每秒发生7笔查询、1笔更新、2笔插入操作,这个负载并不算大,但是变更通常选在空闲时间段,而且对于单表来说已经算很高的负载了。
4按需求创建一个已分区的中间表
以上步骤完成准备工作,开始执行在线重定义过程。
5检查源表是否具备在线重定义的条件
6开始在线重定义,这一步相当于初始化工作,耗时比较长
7在中间表上创建约束和索引并收集统计信息
这一步提前做,可以防止重定义完成后,新表没有可用索引,而产生性能问题。
oracle提供了dbms_redefinition.copy_table_dependents过程,用于复制源表上的索引、约束、触发器、权限等依赖关系到中间表,但是这个包存在的BUG也不少,可以选择性使用。
这一步执行之后,可以再做一次手工同步刷新,耗时15秒
8手工同步数据,将上一步执行中将产生的数据先做同步刷新
9完成在线重定义过程,执行后,中间表和源表的表名互换
10删除中间表,并将索引重命名回来
此时的中间表已经是原来未分区的普通表,而源表已经变成了分区表
至此,使用在线重定义进行表分区改造的工作已经完成。
通过各个步骤的耗时情况可以看到,在我们模拟压力的情况下,整个过程耗时12分钟,而最关键的finish_redef_table步骤,也就是会锁表的步骤,只有2秒就完成了。监控数据库的活动会话、DBTIME等数据,没有感觉到数据库的明显变化。
接下来把模拟压力增加到TPS 100,即每秒发生7笔查询、1笔更新、2笔插入操作,整个操作过程源表上DML的变化趋势图如下:
DML操作略有波动,但每一秒钟都存在DML操作,也就是说在这种压力之下,锁表的时间仍然是毫秒级。这组数据也论证了使用在线重定义进行分区表改造的可行性和稳定性。
要注意的问题
使用在线重定义技术,以下情况是需要注意的: