警示:一个专为AIX上12.1版本定制的Bug正在发生

题记:一些用户在使用 Oracle Database 12.1 版本时(包含12.1.0.1 和 12.1.0.2 初始版本),再次遭遇到一个『专门为 AIX 定制的BUG』,这个BUG的影响非常大,再次提醒大家关注。

前一段,我们发布过一篇文章,题目是:一个专为AIX上11.2.0.4版本定制的Bug正在高发 ,很多朋友回复遇到过这个BUG,并且开始做出修正。最近,随着 12c 用户的逐渐增多,这个版本中的问题也在逐渐的呈现出来。

一些用户在使用 Oracle Database 12.1 版本时(包含12.1.0.1 和 12.1.0.2 初始版本),再次遭遇到一个『专门为 AIX 定制的BUG』,这个BUG的影响非常大,再次提醒大家关注。

这个BUG的编号是:21915719

在MOS上被提升到『警告』级别。

这个BUG的标题是:Database hang or may fail to OPEN in 12c IBM AIX or HPUX Itanium

也就是:数据库在 12c IBM AIX 平台上可能会Hang或者不能OPEN打开,后来加入了可能受到影响的安腾平台。

在出现问题时,数据库出现的错误是:

死锁 或者 ORA-600 [kcrfrgv_nextlwn_scn] ORA-600 [krr_process_read_error_2] 。

Doc ID 1957710.1 ALERT: Bug 21915719 Database hang or may fail to OPEN in 12c IBM AIX or HPUX Itanium - ORA-742, DEADLOCK or ORA-600 [kcrfrgv_nextlwn_scn] ORA-600 [krr_process_read_error_2]

导致这个问题的原因是:

大家知道,在Oracle 12.1 中,数据库将原本单一的 LGWR 进程进化为主从进程的结构,LGWR一个主进程,配合最多100个从属的SLAVE进程工作,可以将原来典型的Log File Sync等待降低,增加数据库的事务率和处理能力。

在云和恩墨的 12.2 体系结构图中,详细描述了这一新特性

『关注本公众号,回复:122ARCH 可以获得电子版 』

就是因为这个新特性的引入,带来了这样的数据库不能启动或者内部错误的风险。

如何规避这种风险:

先说如何规避,Oracle 几乎为每个新特性都设置了开关,可以通过隐含参数 _use_single_log_writer 来控制,将该参数设置为TRUE,就回到了11g的模式,使用单一的LGWR:

ALTER SYSTEM SET "_use_single_log_writer"=TRUE SID='*' SCOPE=SPFILE;

注意:如果数据库已经遇到这个BUG,改参数就来不及了。Oracle 已经为这个BUG提供了补丁修正。这个问题在 12.1.0.2.160419 的 PSU 中修正,如果你已经应用了这个PSU,则无需担忧,否则就应该正视这个问题。

在这个BUG中,Oracle这样描述了如何可能踩到这个大坑。

这个问题仅当以下条件都遭遇时出现:

  1. 在 AIX 平台上的 Oracle 12.1 版本;
  2. LGWR 和 LGWR Slave 进程同时运行在某个实例,处于Hang的挂起状态,没有进一步的日志切换出现,事务无法进行;
  3. 在Hang附近,告警日志可能出现类似 LGWR / LG<nn> waits for event 'LGWR any worker group' for <n>secs 的日志信息;
  4. 转储SYSTEM State可以看到 LGWR 从属进程处于 LGWR worker group ordering 状态等待;
  5. LGWR从属进城等待的核心 lwn_id 是相同的,信息类似:waiting for 'LGWR worker group ordering' lwn_id=0xde ;
  6. 重启可以解决Hang的问题,但是有时候会遇到 ORA-600 [kcrfrgv_nextlwn_scn] or ORA-600 [krr_process_read_error_2] 而无法启动;

综合以上的信息可以看出:

之所以出现挂起是引用:LGWR的Slave进程需要按照顺序(ordering)来接受日志,但是在Power处理器上,因为某些原因并未按照顺序来传递日志,导致所有的Slave进程都在等待某个序号的日志批量,这就导致了挂起。

使用新特性,了解新特性,关注行业动态,对于数据库来说是多么重要。

在使用新版本时,总会遇到新问题,欢迎大家留言和我们分享你的踩坑故事。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2017-08-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

混在运维部的安全员说“端口与口令安全”

? 1. 前言 先简单自我介绍一下,其实,我是一个安全工程师。现就职于某互联网金融企业负责公司整体网络安全。 刚到公司时首先是了解一些企业规则和规则制定者,当...

3833
来自专栏针针小站

【Soft】多语言的下载实用工具 – Nagisa

1124
来自专栏FreeBuf

“撬锁”实战:绕过云锁提权某游戏私服

朋友给我了我一个游戏私服的shell,说是提权不下服务器,让我帮忙看看。本文仅为大家提供一个思路,这个方法可能很多人知道但是并没有公布到网络。我今天写出来只是为...

905
来自专栏信安之路

用powershell下载文件的姿势你研究过吗?

PowerShell 的最大优势在于以 .NET 框架为基础。 .NET 框架在脚本领域几乎是无所不能,这是一个优点,也有可能成为一个方便黑客攻击的一个强大的便...

1210
来自专栏FreeBuf

变换姿势:从DHCP再挖破壳漏洞利用

破壳漏洞(Shellshock)影响深远,利用起来似乎没那么容易,所以对于破壳漏洞研究利用的新方法会间歇性地出现。众所周知,利用破壳漏洞攻击Web应用程序一直是...

1817
来自专栏散尽浮华

分布式监控系统Zabbix-3.0.3-完整安装记录-新报微信报警(企业微信)

一般来说,Zabbix可以通过多种方式把告警信息发送到指定人,常用的有邮件,短信报警方式,但是现在越来越多的企业开始使用zabbix结合微信作为主要的告警方式,...

20410
来自专栏数据和云

DBA生存警示:防范频发的数据误删除操作

编辑手记:对于资深的老DBA们,他们在漫长的职业生涯中养成了很多稀奇古怪的守则,以在复杂多变的环境中“幸存”,这源于无数血泪的教训,我曾经在《数据安全警示录》...

35714
来自专栏北京马哥教育

11个国内外免费域名解析服务

 一般域名使用注册商提供的域名解析服务虽然方便,但功能大多有限,特别是目前国内还会针对某些DNS服务器进行屏蔽,造成网站无法解析的情况出现,因此,使用第三方域名...

48114
来自专栏FreeBuf

RED_HAWK:基于PHP实现的信息收集与SQL注入漏洞扫描工具

今天给大家介绍的这款工具名叫RED HAWK(红鹰??),这是一款采用PHP语言开发的多合一型渗透测试工具,它可以帮助我们完成信息采集、SQL漏洞扫描和资源爬取...

3366
来自专栏菩提树下的杨过

MaCfee导致Asp.net/Jmail无法发送邮件的解决办法

如果你装了杀毒软件,比如我装的 McAfee VirusScan。 他们默认就阻滞程序发送邮件,甚至包括WEB程序,也会阻滞。而我以前只碰到过这个杀毒软件阻滞W...

1715

扫码关注云+社区