运维经验:回滚段异常的特殊救急方法

冷菠

冷菠,资深DBA,著有《Oracle高性能自动化运维》,有近10年的数据库运维、团队管理以及培训经验。擅长数据库备份恢复、数据库性能诊断优化以及数据库自动化运维等。目前致力于大数据、智能一体化、开源云计算等领域的佳实践探索。

当Oracle回滚段异常时,将会影响CR重构、事务锁定、块清除等与回滚段紧密相关的数据库功能,甚至可能会导致数据库无法正常启动。

因此,在回滚段出现异常后,需要对回滚段进行(特殊)恢复,遵循以下原则:

1、介质恢复(Media Recovery)是首要的恢复方式,能保证数据恢复的一致性和完整性;

2、当介质恢复不能解决问题时,可以考虑使用隐藏参数来进行特殊恢复;

3、特殊恢复作为最后的恢复手段,需要对特殊恢复带来的风险、特殊恢复时间以及恢复失败回退机制等要点进行综合评估,尽可能减少数据的丢失。

NOTE

隐藏参数比较危险,需慎重使用。

隐藏参数

Oracle回滚段特殊恢复相关的隐藏参数主要有:

参数_offline_rollback_segments,如下所示:

参数_corrupted_rollback_segments,如下所示:

其中:

1、隐藏参数_offline_rollback_segments在init.ora初始化参数文件中的格式如下:

*._offline_rollback_segments=(r01,r02,r03)

回滚段r01、r02及r03为需要离线(offline)的回滚段。

2、隐藏参数_corrupted_rollback_segments在init.ora初始化参数文件中的格式如下:

*.rollback_segments=(r01,r02,r03) *._corrupted_rollback_segments=(r04)

回滚段r01、r02及r03为需要在线使用(onffline)的回滚段,r4为强制异常的回滚段。

场景

Oracle 回滚段隐藏参数用于回滚段异常导致数据库无法正常工作的特殊恢复场景,主要包括:数据库打开、一致读和块清除、回滚段删除。

回滚段隐藏参数与数据库打开

在数据库打开的过程中,处于_offline_rollback_segments/_corrupted_rollback_segments参数列表中的回滚段有以下特点:

1、数据库不会检查回滚段头事务表信息,同时,回滚段头的活跃事务也不会被标记为“DEAD”或者“已回滚”状态;

2、回滚段处于离线(Offline)状态;

3、回滚段不能分配给新事务使用。

回滚段隐藏参数与一致性读和块清除

对于一致性读与块清除而言,隐藏参数_offline_rollback_segments与_corrupted_rollback_segments在特殊恢复中的作用是不同的。

隐藏参数_offline_rollback_segments当事务槽处于开启状态(ITL Open)的Block与_offline_rollback_segments参数列表上的回滚段相关时,数据库在重新打开过程中需要检查_offline_rollback_segments列表上的回滚段头事务表信息,获取事务的状态:

1、事务提交(Inactive),块清除;

2、事务未提交(Active),其他Session读取该Block时,则需要应用Undo Record来重构CR Copy。

note

尽管offline_rollback_segments列表上的回滚段被Offline,Oracle仍然会读取这些回滚段来检查事务状态,在回滚段Online后应用Undo Record实现回滚。如果offline_rollback_segments列表中存在与事务相关的回滚段坏块,那么Oracle回滚操作就会失败

隐藏参数_corrupted_rollback_segments:当事务槽处于开启状态(ITL Open)的Block与_corrupted_rollback_segments参数列表上的回滚段相关时,数据库在重新打开过程中不会读取_corrupted_rollback_segments列表上的回滚段事务表信息,这样就可以利用这个特性越过系统对回滚段的检查来尝试启动数据库。

1、如果活跃事务没有提交,将会出现逻辑异常错误,可以使用参数_corrupted_rollback_segments来越过系统检查,尝试启动数据库;

2、当_corrupted_rollback_segments列表中的回滚段被删除后,系统会将“DEAD”状态的事务当作已经被提交,进行延迟块清除。

note

隐藏参数_offline_rollback_segments_corrupted_rollback_segments的最大区别是:

1、_offline_rollback_segments列表中的回滚段头事务表在数据库打开过程中需要被读取;

2、_corrupted_rollback_segments列表中的回滚段事务表在数据库打开过程中不需要被读取,Oracle会将_corrupted_rollback_segments列表中的回滚段当作已经“Drop”处理。这样的好处就是可以在回滚段异常时,将异常回滚段添加到_corrupted_rollback_segments参数列表中,越过系统检查,从而打开数据库。

如果在ITL被清除前,标记为“corrupted”状态的回滚段被Oracle重用(从_corrupted_rollback_segmens参数列表中移除),这时就需要回滚之前已经提交事务,导致Block逻辑异常。为了避免这些问题,因此建议在使用隐藏参数_corrupted_rollback_segments后,将参数列表中的回滚段删除。

回滚段隐藏参数与回滚段删除

在一般情况下,Oracle 回滚段是不能被删除(Drop)的,这是因为回滚段中包含了活动事务(Active)信息,保存了事务恢复的回滚记录。为了保护数据的一致性,Oracle不允许删除有活动事务的回滚段。

在特殊情况下,将存在活动事务的回滚段添加到_corrupted_rollback_segments列表中,就可以忽略回滚段保护机制。也就是说,在数据库启动过程中,处于_corrupted_rollback_segments列表中包含有活动事务的回滚段可以被删除。方法就是将该回滚段添加到_corrupted_rollback_segments列表中。删除活动事务回滚段示例如下:

note

在使用_corrupted_rollback_segments参数后,数据库运行可能比较正常,但是出现问题的潜在风险将增大;删除_corrupted_rollback_segments列表中包含有活动事务的回滚段时,存在逻辑错误的风险以及数据字典异常的风险,这可能将是一种灾难,因此需要慎用该参数;建议在大多数情况下保持数据库的正常启动,尽可能少地使用隐藏参数,规避风险。

实战

当存在活动事务的回滚段表空间出现异常时,可以通过以下步骤进行特殊恢复。

1、创建新的init.ora初始化参数文件(pfile),语法格式如下:

create pfile=<path> from spfile;

2、修改新init.ora初始化参数文件,将异常回滚段表空间的回滚段添加_corrupted_rollback_segments参数列表中,如下所示:

note

一般情况下,只需要将异常回滚段添加到_corrupted_rollback_segments列表中即可,如果回滚段表空间中所有回滚段都异常,则需要将所有异常的回滚段都添加到_corrupted_rollback_segments列表中。

3、使用修改后的init.ora初始化参数文件启动数据库:

startup restrict pfile='<pfile_path>';

nOTE

在数据库启动过程中,可以根据需要使用open resetlogs的方式打开数据库(只有部分数据丢失)。

4、在启动成功的数据中创建新的回滚段表空间,语法如下:

create undo tablespace undotbs2 datafile '<path>' size 16384mautoextend retention noguarantee;

5、删除异常的回滚段表空间,使用以下命令:

alter tablespace undotbs1 offline immediate; drop tablespace undotbs1 including contents and datafiles;

note

当删除异常的回滚段表空间完成后,_corrupted_rollback_segment列表中只有与活动事务相关的回滚段存在部分数据丢失。这样就保证了数据库正常启动的同时,也尽可能地减少了数据的丢失。

6、使用以下命令,关闭数据库

shutdown immediate;

7、修改init.ora初始化参数文件,重新配置新的回滚段表空间,如下所示:

8、正常启动数据库,并重建spfile

startup; create spfile from pfile=<path>;

至此,基于隐藏参数的回滚段特殊恢复就告一段落。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2017-09-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏后端技术探索

Nginx如何做流量控制

英文原文:https://www.nginx.com/blog/rate-limiting-nginx/

3294
来自专栏Seebug漏洞平台

DeDeCMS v5.7 密码修改漏洞分析

织梦内容管理系统(DedeCms)以简单、实用、开源而闻名,是国内最知名的PHP开源网站管理系统,也是使用用户最多的PHP类CMS系统,在经历多年的发展,目前的...

4548
来自专栏北京马哥教育

10个方法助你轻松完成Linux系统恢复

在Linux中有一些应用程序可以帮助你保存系统快照。大多数应用程序都是针对于新手的,并不需要高级的Linux操作技巧。我们在这里挑选了10个,你可以从中选择适合...

4595
来自专栏编程微刊

如何在本地运行查看github上的开源项目

1176
来自专栏程序猿DD

使用Consul做服务发现的若干姿势

来源:http://blog.bossma.cn/consul/consul-service-register-and-discovery-style/?hms...

3773
来自专栏企鹅号快讯

g4e基础篇#4 了解Git存储库

Git 存储库看上去就是一个文件夹,只是在这个文件夹中不仅仅保存了所有文件的当前版本,也同时保存了所有的历史记录,这些额外的信息都保存在当前文件夹下面的.git...

2176
来自专栏锦小年的博客

pycharm使用笔记2-远程连接

随着科技的发展,远程办公已经是一种趋势,远程开发能力对于每一个程序员来说都是必不可少的。有时候就算在公司,在进行开发的时候有许多的数据都是储存在服务器上的,所以...

35010
来自专栏数据和云

Linux Bug: free cache 导致数据库实例crash

李真旭(Roger) ACOUG 核心专家,Oracle ACE,云和恩墨技术专家 编辑手记:linux 文件系统的cache分为2种:page cache和 ...

2996
来自专栏涤生的博客

服务框架之注册中心,你不知道的内幕

前一篇服务框架技术栈粗略分析了服务框架需要的各个核心模块,首先提到的就是注册中心,注册中心实现了服务注册和发现的功能,在服务框架中也发挥着重要的作用。今天主要围...

1012
来自专栏乐百川的学习频道

使用内网穿透工具frp

前几天写了篇文章用本机电脑搭建网站(域名、DNS解析),写完第二天发现我的网站访问不上去了。仔细研究了一下,发现我想的太简单了。很早一些时候,运营商会给我们分配...

1.4K11

扫码关注云+社区