运维经验:回滚段异常的特殊救急方法

冷菠

冷菠,资深DBA,著有《Oracle高性能自动化运维》,有近10年的数据库运维、团队管理以及培训经验。擅长数据库备份恢复、数据库性能诊断优化以及数据库自动化运维等。目前致力于大数据、智能一体化、开源云计算等领域的佳实践探索。

当Oracle回滚段异常时,将会影响CR重构、事务锁定、块清除等与回滚段紧密相关的数据库功能,甚至可能会导致数据库无法正常启动。

因此,在回滚段出现异常后,需要对回滚段进行(特殊)恢复,遵循以下原则:

1、介质恢复(Media Recovery)是首要的恢复方式,能保证数据恢复的一致性和完整性;

2、当介质恢复不能解决问题时,可以考虑使用隐藏参数来进行特殊恢复;

3、特殊恢复作为最后的恢复手段,需要对特殊恢复带来的风险、特殊恢复时间以及恢复失败回退机制等要点进行综合评估,尽可能减少数据的丢失。

NOTE

隐藏参数比较危险,需慎重使用。

隐藏参数

Oracle回滚段特殊恢复相关的隐藏参数主要有:

参数_offline_rollback_segments,如下所示:

参数_corrupted_rollback_segments,如下所示:

其中:

1、隐藏参数_offline_rollback_segments在init.ora初始化参数文件中的格式如下:

*._offline_rollback_segments=(r01,r02,r03)

回滚段r01、r02及r03为需要离线(offline)的回滚段。

2、隐藏参数_corrupted_rollback_segments在init.ora初始化参数文件中的格式如下:

*.rollback_segments=(r01,r02,r03) *._corrupted_rollback_segments=(r04)

回滚段r01、r02及r03为需要在线使用(onffline)的回滚段,r4为强制异常的回滚段。

场景

Oracle 回滚段隐藏参数用于回滚段异常导致数据库无法正常工作的特殊恢复场景,主要包括:数据库打开、一致读和块清除、回滚段删除。

回滚段隐藏参数与数据库打开

在数据库打开的过程中,处于_offline_rollback_segments/_corrupted_rollback_segments参数列表中的回滚段有以下特点:

1、数据库不会检查回滚段头事务表信息,同时,回滚段头的活跃事务也不会被标记为“DEAD”或者“已回滚”状态;

2、回滚段处于离线(Offline)状态;

3、回滚段不能分配给新事务使用。

回滚段隐藏参数与一致性读和块清除

对于一致性读与块清除而言,隐藏参数_offline_rollback_segments与_corrupted_rollback_segments在特殊恢复中的作用是不同的。

隐藏参数_offline_rollback_segments当事务槽处于开启状态(ITL Open)的Block与_offline_rollback_segments参数列表上的回滚段相关时,数据库在重新打开过程中需要检查_offline_rollback_segments列表上的回滚段头事务表信息,获取事务的状态:

1、事务提交(Inactive),块清除;

2、事务未提交(Active),其他Session读取该Block时,则需要应用Undo Record来重构CR Copy。

note

尽管offline_rollback_segments列表上的回滚段被Offline,Oracle仍然会读取这些回滚段来检查事务状态,在回滚段Online后应用Undo Record实现回滚。如果offline_rollback_segments列表中存在与事务相关的回滚段坏块,那么Oracle回滚操作就会失败

隐藏参数_corrupted_rollback_segments:当事务槽处于开启状态(ITL Open)的Block与_corrupted_rollback_segments参数列表上的回滚段相关时,数据库在重新打开过程中不会读取_corrupted_rollback_segments列表上的回滚段事务表信息,这样就可以利用这个特性越过系统对回滚段的检查来尝试启动数据库。

1、如果活跃事务没有提交,将会出现逻辑异常错误,可以使用参数_corrupted_rollback_segments来越过系统检查,尝试启动数据库;

2、当_corrupted_rollback_segments列表中的回滚段被删除后,系统会将“DEAD”状态的事务当作已经被提交,进行延迟块清除。

note

隐藏参数_offline_rollback_segments_corrupted_rollback_segments的最大区别是:

1、_offline_rollback_segments列表中的回滚段头事务表在数据库打开过程中需要被读取;

2、_corrupted_rollback_segments列表中的回滚段事务表在数据库打开过程中不需要被读取,Oracle会将_corrupted_rollback_segments列表中的回滚段当作已经“Drop”处理。这样的好处就是可以在回滚段异常时,将异常回滚段添加到_corrupted_rollback_segments参数列表中,越过系统检查,从而打开数据库。

如果在ITL被清除前,标记为“corrupted”状态的回滚段被Oracle重用(从_corrupted_rollback_segmens参数列表中移除),这时就需要回滚之前已经提交事务,导致Block逻辑异常。为了避免这些问题,因此建议在使用隐藏参数_corrupted_rollback_segments后,将参数列表中的回滚段删除。

回滚段隐藏参数与回滚段删除

在一般情况下,Oracle 回滚段是不能被删除(Drop)的,这是因为回滚段中包含了活动事务(Active)信息,保存了事务恢复的回滚记录。为了保护数据的一致性,Oracle不允许删除有活动事务的回滚段。

在特殊情况下,将存在活动事务的回滚段添加到_corrupted_rollback_segments列表中,就可以忽略回滚段保护机制。也就是说,在数据库启动过程中,处于_corrupted_rollback_segments列表中包含有活动事务的回滚段可以被删除。方法就是将该回滚段添加到_corrupted_rollback_segments列表中。删除活动事务回滚段示例如下:

note

在使用_corrupted_rollback_segments参数后,数据库运行可能比较正常,但是出现问题的潜在风险将增大;删除_corrupted_rollback_segments列表中包含有活动事务的回滚段时,存在逻辑错误的风险以及数据字典异常的风险,这可能将是一种灾难,因此需要慎用该参数;建议在大多数情况下保持数据库的正常启动,尽可能少地使用隐藏参数,规避风险。

实战

当存在活动事务的回滚段表空间出现异常时,可以通过以下步骤进行特殊恢复。

1、创建新的init.ora初始化参数文件(pfile),语法格式如下:

create pfile=<path> from spfile;

2、修改新init.ora初始化参数文件,将异常回滚段表空间的回滚段添加_corrupted_rollback_segments参数列表中,如下所示:

note

一般情况下,只需要将异常回滚段添加到_corrupted_rollback_segments列表中即可,如果回滚段表空间中所有回滚段都异常,则需要将所有异常的回滚段都添加到_corrupted_rollback_segments列表中。

3、使用修改后的init.ora初始化参数文件启动数据库:

startup restrict pfile='<pfile_path>';

nOTE

在数据库启动过程中,可以根据需要使用open resetlogs的方式打开数据库(只有部分数据丢失)。

4、在启动成功的数据中创建新的回滚段表空间,语法如下:

create undo tablespace undotbs2 datafile '<path>' size 16384mautoextend retention noguarantee;

5、删除异常的回滚段表空间,使用以下命令:

alter tablespace undotbs1 offline immediate; drop tablespace undotbs1 including contents and datafiles;

note

当删除异常的回滚段表空间完成后,_corrupted_rollback_segment列表中只有与活动事务相关的回滚段存在部分数据丢失。这样就保证了数据库正常启动的同时,也尽可能地减少了数据的丢失。

6、使用以下命令,关闭数据库

shutdown immediate;

7、修改init.ora初始化参数文件,重新配置新的回滚段表空间,如下所示:

8、正常启动数据库,并重建spfile

startup; create spfile from pfile=<path>;

至此,基于隐藏参数的回滚段特殊恢复就告一段落。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2017-09-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Ryan Miao

Mybatis高级查询之关联查询

learn from:http://www.mybatis.org/mybatis-3/zh/sqlmap-xml.html#Result_Maps 关联查询 ...

50414
来自专栏Java技术

MySQL开发规范与使用技巧总结

1.库名、表名、字段名必须使用小写字母,并采用下划线分割。 a)MySQL有配置参数lower_case_table_names,不可动态更改,Linux系统...

733
来自专栏林欣哲

MySQL数据库开发规范知识点速查

数据库设计规范 命名规范 基本设计规范 索引设计规范 字段设计规范 SQL开发规范 操作行为规范 命名规范 对象名称使用小写字母并用下划线分割 禁止使用MySQ...

33711
来自专栏决胜机器学习

《Redis设计与实现》读书笔记(二十八) ——Redis集群节点结构与槽分配

《Redis设计与实现》读书笔记(二十八) ——Redis集群节点结构与槽分配 (原创内容,转载请注明来源,谢谢) 一、概述 redis集群是...

3396
来自专栏技术博文

多表关联是ON和WHERE的区别

很多时候,开发在书写SQL的时候不能正确的理解和运用ON和WHERE的区别。今天就简单演示介绍下(有图有真相)。 原理:数据库在通过连接多张表来返回记录时,都会...

3177
来自专栏工科狗和生物喵

【计算机本科补全计划】Mysql 学习小计(1)

正文之前 以后是要做大数据的人,如果连结构化的数据库都不会的话,那岂不是笑死人?所以果断靠着当年兴趣盎然的时候学的那点基础来复习一下,发现果然学过一遍再来复习那...

3215
来自专栏企鹅号快讯

在.NET Core 中的并发编程

原文地址:http://www.dotnetcurry.com/dotnet/1360/concurrent-programming-dotnet-core 今...

2549
来自专栏Java Edge

Redis实现分布式锁Redis分布式锁安全和活性失效保障为什么基于故障转移的实现还不够Redis分布式锁防死锁单Redis实例实现分布式锁的正确方法Redlock算法这个算法是异步的么?失败时重试释

3007
来自专栏JavaWeb

Mysql索引原理深入剖析

3053
来自专栏王亚昌的专栏

Linux进程同步机制-Futex

引子 在编译2.6内核的时候,你会在编译选项中看到[*] Enable futex support这一项,上网查,有的资料会告诉你"不选这个内核不一定能正确的运...

971

扫描关注云+社区