前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Oracle数据库常用undo查询思路

Oracle数据库常用undo查询思路

作者头像
数据和云
发布2021-03-30 16:01:41
7220
发布2021-03-30 16:01:41
举报
文章被收录于专栏:数据和云数据和云

墨墨导读:最近处理了几次undo相关问题,将undo暴增后查询思路整理分享至此。

最近处理了几次undo相关问题,将undo暴增后查询思路整理如下:

  • 查询active状态的使用空间
  • 确认使用的详细情况,比如占用高的sid与sql,以及是否存在死事务
  • 应急处理方法

1. 查询undo active使用状态

代码语言:javascript
复制
select tablespace_name, status, round( sum( bytes ) / 1048576, 2 ) mb,
count(*) extent_count
from dba_undo_extents
group by tablespace_name, status
order by tablespace_name, status;

TABLESPACE_NAME      STATUS                MB EXTENT_COUNT

-------------------- ------------ ----------- ------------

UNDOTBS1             ACTIVE           17.13          19  --主要关注活动部分

UNDOTBS1             EXPIRED          15.25          64

UNDOTBS1             UNEXPIRED         8.19          11
代码语言:javascript
复制

UNEXPIRED已经释放,在保留期内。无需手动处理,在undo表空间紧张时,undo会自动调整undo保留期的,参考如下:

代码语言:javascript
复制
select to_char(begin_time, 'hh24:mi:ss') BEGIN_TIME,
to_char(end_time, 'hh24:mi:ss') END_TIME,
maxquerylen,
nospaceerrcnt,
tuned_undoretention
from v$undostat;

BEGIN_TI END_TIME MAXQUERYLEN NOSPACEERRCNT TUNED_UNDORETENTION

-------- -------- ----------- ------------- -------------------

17:37:31 17:43:00        1281           0                2062

17:27:31 17:37:31        978            0                1759

17:17:31 17:27:31        372            0                1153

17:07:31 17:17:31        974            0                1755

16:57:31 17:07:31        368            0                1151

16:47:31 16:57:31        968            0                1809

16:37:31 16:47:31        363            0                1205

16:27:31 16:37:31        961            0                1805

16:17:31 16:27:31        358            0                1200

16:07:31 16:17:31        957            0                1799

15:57:31 16:07:31        353            0                1195

15:47:31 15:57:31        953            0                1794

15:37:31 15:47:31        349            0                1190

15:27:31 15:37:31        948            0                1790

15:17:31 15:27:31        342            0                1185

最后一列就是undo的保留期,可以看到会根据使用情况自动调整。

2. 确认占用的sid与使用大小

代码语言:javascript
复制
select s.sid, substr( s.program, 1, 15 ) program,
  s.machine,
  t.xidusn || '.' || t.xidslot || '.' || t.xidsqn tx_addr,
  t.status, t.start_time, tbs.tablespace_name tbs_name,
  round( t.used_ublk * tbs.block_size /1048576, 2 ) undo_size_mb,
  t.used_urec
from v$transaction t, v$session s, v$parameter p, dba_tablespaces tbs
where t.ses_addr = s.saddr
  and p.name = 'undo_tablespace' 
  and p.value = tbs.tablespace_name
order by t.used_ublk desc;


  SID PROGRAM        MACHINE          TX_ADDR      STATUS    START_TIME        TBS_NAME    UNDO_SIZE_MB  USED_UREC


----- --------------- ---------------- ------------- ---------- ------------------ ------------ ------------ ----------


1 sqlplus@localho localhost.localdomain 7.31.582      ACTIVE    02/03/20 11:09:45  UNDOTBS1            15.84    199906

Active总共17M,SQLPLUS就占用了15.85M。

3. 确认占用sql

代码语言:javascript
复制
SELECT S.SID,
        S.USERNAME,
        U.NAME,
        Q.SQL_TEXT,
        Q.HASH_VALUE,
        T.UBABLK
    FROM V$TRANSACTION T,
        V$ROLLSTAT R,
        V$ROLLNAME U,
        V$SESSION S,
        V$SQL Q
  WHERE    S.TADDR = T.ADDR
        AND T.XIDUSN = R.USN
        AND R.USN = U.USN
        AND Q.HASH_VALUE =
                DECODE(S.SQL_HASH_VALUE,
                        NULL, S.PREV_HASH_VALUE,
                        S.SQL_HASH_VALUE)
ORDER BY S.USERNAME;

  SID USERNAME        NAME                          SQL_TEXT                                HASH_VALUE    UBABLK
----- --------------- ------------------------------ ---------------------------------------- ---------- ----------
1 SYS            _SYSSMU7_831131319$            update t1 set id=9                        71029355      5213
代码语言:javascript
复制

本次模拟对一张10w数据的表进行update。通过以上信息可以看到,sys用户通过本地sqlplus登陆,执行updata语句。

但有时候会发现,明明active的空间已经很大,但是v$transaction却查不到,需要关注死事务的产生。

4. 死事务的查询

http://blog.itpub.net/22034023/viewspace-710505/

死事务出现在异常关闭数据库或者事务进程不正常结束,比如KILL -9,shutdown abort的情况下。即使是DBA也只能等待smon清理完成,没有好的办法。当然禁用smon这种方法,如:

代码语言:javascript
复制
oradebug setorapid 'SMON's Oracle PID';
oradebug event 10513 trace name context forever, level 2
代码语言:javascript
复制

这种在生产中绝对是谨慎谨慎,除非有着非常深入的理解和实践。

当前数据库里的死事务可以通过查询内部表x$ktuxe来获得。

代码语言:javascript
复制
select ADDR,KTUXEUSN,KTUXESLT,KTUXESQN,KTUXESIZ from x$ktuxe where KTUXECFL='DEAD';


ADDR               KTUXEUSN   KTUXESLT   KTUXESQN   KTUXESIZ
---------------- ---------- ---------- ---------- ----------
00002B92FF5D5F68         15         12     314961      43611
代码语言:javascript
复制

KTUXESIZ代表需要回滚的回滚块数。

死事务的回滚进程数可以通过参数fast_start_parallel_rollback来设置。

可以根据以下算法来粗略的估算回滚需要的时间,这里是小时:

代码语言:javascript
复制
declare
  l_start number;
  l_end   number;
begin
  select ktuxesiz
    into l_start
    from x$ktuxe
   where KTUXEUSN = 10
     and KTUXESLT = 39; ---------这里根据实际数字来填写
  dbms_lock.sleep(60);  ---------可以缩小这个时间,但是太小,可能会导致误差较大
  select ktuxesiz
    into l_end
    from x$ktuxe
   where KTUXEUSN = 10
     and KTUXESLT = 39; ---------这里根据实际数字来填写
  dbms_output.put_line('time cost Day:' ||
                       round(l_end / (l_start - l_end) / 60, 2));
end;
/
代码语言:javascript
复制

5. 应急处理

  • 如果占用undo高的是执行不合适的sql导致,那么可以临时kill掉。事后也可以让开发针对sql的提交方式进行优化。
  • 如果是死事务,只能通过上述方法进行计算时间。无法手工干预。
  • 如果应急期间定位不到具体问题,那最紧要的就是扩容undo表空间,确保生产事务正常运行。

作者

王茂材,云和恩墨技术顾问,从事Oracle DBA工作5年,维护过200+ 套Oracle数据库,涉及能源、医疗、体彩、银行、运营商等行业数据库的维护和操作。对Oracle数据库具备扎实的理论基础与丰富的实践经验,擅长故障处理、迁移、备份恢复、SQL优化等。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据和云 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 查询undo active使用状态
  • 3. 确认占用sql
  • 4. 死事务的查询
  • 5. 应急处理
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档