故障分析:一则library cache lock问题处理

编辑手记:library cache lock 大家都并不陌生,在MOS上对该阻塞的一般成因描述为:一般可以理解的是alter table或者alter package/procedure会以X模式持有library cache lock,造成阻塞(444560.1)。但针对具体问题仍要具体分析,今天分享一则因SQL绑定变量出现空值,导致大量子游标产生并引发library cache lock 的故障,供大家参考借鉴。

请故障现象及影响

某数据库为Oracle 11.2.0.3.9 RAC Linux 64bit,一天晚上9点左右,业务系统反应缓慢,数据库曾发现有大量library cache lock等待事件,并伴随有library cache:mutex X,导致业务系统短暂无法正常提供业务处理

问题分析

当天起发现数据库有大量librarycache lock,平均等待有1775ms ,并伴随有librarycache: mutex X。

观察ASH报告,等待library cache lock会话在执行SQL如下

对比上周同一天的AWR,这个SQL执行的次数差不多,大概半小时7万次左右,但在23号的AWR中,该SQL在Order by Version Count出现,Version Count为76(实际上在v$sql中发现有2万个 不同CHILD_ADDRESS出现),说明该SQL产生过2万个子游标。这里也看到其他SQL High Version,但由于其他SQL执行没有0pjnn575vchbg频繁,并不引发library cache lock等待。

该SQL已占用了1GB的共享池空间

结合数据库版本和环境情形,初步推断为ACS BUG引发。但在关闭ACS特性后,library cache lock等待事件与子游标依然存在。

这样排除了ACS BUG引起后。观察V$SQL_SHARED_CURSOR中大量BIND_MISMATCH,但BIND_MISMATCH根据Oracle的规则,只有5,6种不同的可能性,不至于产生2万个子游标。进一不查看V$SQL_BIND_CAPTURE发现绑定变量值中,出现异常的varchar2类型,且值为空。结合Bug 8198150 - High Versioncount with bind_mismatch with passing null value to bind (文档 ID 8198150.8),推断该SQL绑定变量时输入了空值,导致产生大量子游标。在V$SQL_BIND_CAPTURE视图中表现为VARCHAR2类型(varchar2为Oracle默认类型,null值无类型则为Oracle默认类型)。

应用做调整限制SQL绑定NULL输入后,SQL正常,无子游标产生。

处理过程总结

  • 通过故障的情况相关信息初步推断为ACS(自适应)bug引起。
  • 在关闭ACS特性后观察,SQL子游标和librarycache lock等待事件依然存在。
  • 进步分析并通过测试确认,原因由于SQL绑定变量输入null值触发BUG,导致会产生大量子游标,引发library cache lock等待。在应用代码中将null限制后SQL正常

后续工作建议

  • 应用端严格限制非合理的绑定变量时null值输入。
  • 建议给数据库打上最新PSU,避免触发各BUG,提高系统健壮性。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2016-10-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏挖掘大数据

大数据面试秘诀:30道hadoop面试真题和解析

近年来,大数据概念被炒的非常热,大数据公司也在快速的崛起,而人才的需求也越来越多。对于正在找大数据相关工作的同学们来说,面试时遇到什么问题才是他们最关心的。在下...

23410
来自专栏java一日一条

如何从 MongoDB 迁移到 MySQL

最近的一个多月时间其实都在做数据库的迁移工作,我目前在开发的项目其实在上古时代是使用 MySQL 作为主要数据库的,后来由于一些业务上的原因从 MySQL 迁移...

835
来自专栏程序猿

一份DBA试题

注:以下题目,可根据自己情况挑选题目作答,不必全部作答您也可以就相关问题直接找负责面试人员面述而不笔答。 一:SQL tuning 类 1:列举几种表连接方式 ...

2897
来自专栏个人分享

sparksql工程小记

  最近做一个oracle项目迁移工作,跟着spark架构师学着做,进行一些方法的总结。

832
来自专栏乐沙弥的世界

MongoDB执行计划获取(db.collection.explain())

933
来自专栏微信公众号:Java团长

《阿里巴巴Java工作手册》学习笔记

最近浏览了一下阿里巴巴的Java开发手册,感觉内容确实非常的赞,发现了不少自己在编程中的误区,因此决定通过成文牢固掌握,文中将选取个人认为比较重要的部分进行描述...

631
来自专栏菜鸟程序员

EternalBlue(永恒之蓝)工具漏洞利用细节分析

732
来自专栏Java帮帮-微信公众号-技术文章全总结

Activiti学习详解【面试+工作】

一:Activiti第一天 1:工作流的概念 ? 说明: 1) 假设:这两张图就是XX兄弟的请假流程图 2) 图的组成部分: A. 人物:范XX 冯X刚 王X军...

4405
来自专栏SAP最佳业务实践

想学FM系列(21)-SAP FM模块:派生规则推导策略(4)-派生规则推导步骤-功能模块

4.1.6 功能模块 在推导步骤过程中调用一个功能函数,将源数据字段值传入功能函数的参数值,再把功能函数执行后的结果数据值传出到目标字段。 在选择步骤类型为功能...

49110
来自专栏大数据和云计算技术

MongoDB系列8:MongoDB集合的增量更新

在关系型数据库中,经常会遇到这样的场景:用某张表或是多张表的关联产生的结果集,然后持续地更新另外一张表的数据,有时为了方便,只更新变化的数据,即增量更新。那么在...

1013

扫码关注云+社区