专栏首页bisal的个人杂货铺kill等待session的方法 - 引申自恩墨面试题的一些思考

kill等待session的方法 - 引申自恩墨面试题的一些思考

Kamus曾在微信公众号发表了一篇文章《删繁就简 - 云和恩墨的一道面试题解析》,恩墨的新书《Oracle性能优化与诊断案例精选》第五章引用了相同的文章,来自恩墨的一道面试题,乍一看其中涉及的知识点,大部分比较眼熟,但开始解决的时候,能否清晰地完成,就因人而异了。

从我的认识来看,对于日常的工作,有一些值得总结和借鉴的,因此写出来分享一下,欢迎各位提出其他的建议,共同完善。

一、原文描述

题目是:请将 emp.empno=7369 的记录 ename 字段修改为“ENMOTECH”并提交,你可能会遇到各种故障,请尝试解决。 其实题目的设计非常简单,一个 RAC 双节点的实例环境,面试人员使用的是实例2,而我们在实例1中使用 select for update 将 EMP 表加锁: SQL> SELECT * FROM emp FOR UPDATE; 此时在实例2中,如果执行以下 SQL 语句尝试更新 ename 字段,必然会被行锁堵塞: SQL> UPDATE emp SET ename='ENMOTECH' WHERE empno=7369; 这道面试题中包含的知识点有: 如何在另外一个 session 中查找被堵塞的 session 信息; 如何找到产生行锁的 blocker; 在杀掉 blocker 进程之前会不会向面试监考人员询问,我已经找到了产生堵塞的会话,是不是可以kill掉; 在获得可以 kill 掉进程的确认回复后,正确杀掉另一个实例上的进程。 这道题我们期待可以在5分钟之内获得解决,实际上大部分应试者在15分钟以后都完全没有头绪。

创建测试表,

session 1执行更新empno=7902行记录的SQL语句,

此时session 2执行相同的SQL语句,由于session 1更新的事务未提交,因此行锁未释放,session 2处于hang,

根据v$session和v$sql,检索包含'update bisal_emp'的语句正等待什么,

得知session id是35,用户名为BISAL,update bisal_emp这条SQL语句,正等待行锁争用的事件,等待的是TX锁。

检索gv$session,了解35号session被什么session阻碍,由于原文使用的是RAC,因此使用了gv$session且inst_id不同,我这实验用的是单实例,因此虽然可以使用gv$session视图,但inst_id默认为1,

得知35号session等待的是54号session。

根据sid信息,检索其serial#,使用alter system kill session 'sid, serial#'来kill阻碍的session,

此时session 1执行任何SQL,会提示ORA-00028,需要重新登录。

session 2则会提示SQL执行完成,说明session 2已经有了该行的TX锁,

以上是原文整体的实验,略有出入,基本保持一致。

二、引申-检索等待的对象

原文中已知了具体SQL有等待,要是不知道具体SQL,只是说明有一个session执行SQL处于hang,是否可以知道等待的是什么?

当然可以,v$locked_object中存储了等待的对象信息,

进一步我们可以根据v$locked_object和dba_objects,了解等待的对象是什么,

三、引申-一键解决等待

原文Kamus总结了一句,

忽然感觉网上那些一气呵成的故障诊断脚本其实挺误人的,只需要给一个参数,运行一下脚本就列出故障原因。所以很少人愿意再去研究这个脚本为什么这么写,各个视图之间的联系是如何环环相扣的。所以当你不再使用自己的笔记本,不再能迅速找到你赖以生存的那些脚本,你还能一步一步地解决故障吗?

说的很有道理,工具有时候简化了我们的工作,但往往屏蔽了技术细节,如果不了解背后的原理,我们只是工具的使用者,机械的执行,但若了解了背后的原理,不用工具,我们同样可以处理问题,或者改进工具,更适合我们的实际需求。

根据上面的实验,其实我们可以将过程封装,一键解决SQL等待的问题,如下是脚本,其实比较唬人,仔细看一下,和上面实验中用到的SQL基本一致,略有调整。

脚本首先执行set serveroutput on打开存储过程输出控制。

接着提示'SQL TEXT',接受SQL语句的部分字符串为输入。

第一条SQL,根据输入的SQL_TEXT,得到包含SQL_TEXT的SQL等待什么,注意由于SQL_TEXT是模糊匹配,这需要使用sid<>的方式来屏蔽执行本脚本的session,得到的SQL就是需要的语句。

第二条SQL则找出阻碍session的信息。

第三条SQL根据前面两条SQL的信息,拼接出alter system kill session 'sid, serial#'语句。

直接copy执行这条SQL,就可以完成阻碍进程的kill,完成需求。

如下是执行脚本的输出,

脚本原文可以从我的GitHub上下载,

https://github.com/bisal-liu/oracle/blob/master/lock.sql

总结:

1. 看似简单的问题,要有清晰的思路,才能完美的解决,这需要具备扎实的基本功,以及沉着冷静的心态。

2. 了解工具背后的原理,有助于我们理解问题的解决思路,不是被动地使用工具,才能真正驾驭这些工具,为我们所用。

如果您觉得此篇文章对您有帮助,欢迎关注微信公众号:bisal的个人杂货铺,您的支持是对我最大的鼓励!共同学习,共同进步:)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 一个开发需求的解决方案 & Oracle临时表介绍

    一、开发需求 最近有一个开发需求,大致需要先使用主表,或主表和几张子表关联查询出ID(主键)及一些主表字段,然后再用这些ID查找最多10张表中对应的记录,主...

    bisal
  • 【Oracle】-【插入读取顺序】-插入读取之间的顺序关系

    SQL> create table t ( x int, a char(2000) default 'x', b char(2000) default '...

    bisal
  • 【每日一摩斯】-Shared Pool优化和Library Cache Latch冲突优化 (1523934.1)-系列2

    在有完整的统计信息并且SQL语句在predicate(限定条件)中使用具体值时,基于成本的优化器 (CBO)能工作的最好。比较下面

    bisal
  • web服务器集群集群是什么?分布式是什么?集中式是什么?例子缺点

    概述 集群和分布式都是从集中式进化而来的。分布式和集群会相互合作的,同时的集群和分布式。在这里重点说说集群 集群是什么? 集群能提高单位时间内处理的任务数量,提...

    用户1174983
  • Azure恢复服务-配置DPM联机保护

    从System Center 2012 Service Pack 1开始,我们可以使用DPM把被保护的服务器和数据备份到Microsoft Azure备份保管库...

    李珣
  • 大数据技术之_06_Zookeeper学习_Zookeeper入门+Zookeeper安装+Zookeeper内部原理+Zookeeper实战(开发重点)+企业面试真题

      Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。

    黑泽君
  • 「GPUImage」IOS初学者容易掉入的坑

    今天想弄个GPUImage的例子运行下看看效果,结果没成想坑进了一系列坑中,花了大半天时间才从坑里爬出来。

    音视频_李超
  • 3Python全栈之路系列之字符串数据类

    字符串类型是python的序列类型,他的本质就是字符序列,而且python的字符串类型是不可以改变的,你无法将原字符串进行修改,但是可以将字符串的一部分复制到新...

    py3study
  • Python全栈之路系列之字符串数据类

    字符串类型是python的序列类型,他的本质就是字符序列,而且python的字符串类型是不可以改变的,你无法将原字符串进行修改,但是可以将字符串的一部分复制到新...

    py3study
  • Linux上安装Zookeeper以及一些注意事项

    最近打算出一个系列,介绍Dubbo的使用。 ---- 分布式应用现在已经越来越广泛,Spring Could也是一个不错的一站式解决方案,不过据我了解国内目前貌...

    江南一点雨

扫码关注云+社区

领取腾讯云代金券