有这样一个数据库“灵异事件”等你来解答

大家好,最近《冲顶大会》《芝士超人》《百万英雄》等直播答题类 APP 可谓是火极一时,许多人加入后只恨没有把小学老师捆来当智囊团,当然也有人从中斩获颇丰,充分向大家解释了什么叫做 “知识就是力量”。

说到知识就是力量,小编自然也是再同意不过了,不过并不是纯粹的知识就能解决所有问题,有时候更多也要依靠经验,比如在面对“数据库”等这些实操类问题的时候,往往会有书本知识解答不了的“灵异事件”发生,而工作出现的事故,大部分都是人祸,有些至今还找不到原因,无法理解,完全超出认知。

面对这些灵异事件,我们觉得有必要请出高手来参加这样一种“冲顶大会”了:

我们会汇集网友工作中发生的“灵异事件”,然后发布出来,集思广益,也会把解题思路的结果公布出来供大家票选,最优解决方案会有礼品送上。(本期奖品请往下看哦~)

征集令

本期题目:数据库“灵异事件”

问题描述:

1 LINUX, ORACLE 11203, 单节点,无任何补丁。

2 应用系统做某个会计查询,查询范围,1到2个月时正常,若大于2个月:3或3个月以上,就报错。

应用系统反馈回来的错误号为:0RA-604,ORA-1013,同时还有一段插入代码,INSERT INTO TMPXXXXX SELECT XXX FROM XXX。 测试过 SELECT 部分,执行正常。

3 上面 TMPXXXXX,是应用系统为响应复杂查询时,创建的一个唯一性的临时使用的表,是应用系统自己的临时表,非ORACLE的临时表,也就是,TMPXXXXX 其实也是个普通的堆表,用完后删除。TMP 是标识,XXXXX 是唯一码,确保TMPXXXXX 表名唯一。

4 从应用系统反馈的信息,无法判断出问题的根源。咨询后,在数据库里做了 604 的ERRORSTACK事件。

5 设置后,再尝试会计查询操作,后台警告日志里记录了 3 次错误,第3次,就是上面应用系统上看到的错误;前2次,都是报 ORA-604,ORA-904,提示:在一个 MERGE INTO TMPA A1 USING

(SELECT XXXX FROM TMPA B1 WHERE (此处有多个关联条件) AND A1.XXX=B1.XXX),B1.XXX 字段不存在,

但实际上,B1.XXX 字段是存在的。

6 前两次错误,都是类似的语句,我跟踪时,发现第1次的 TMPXXXXX 对象已经不存在了;但第2次的 TMPXXXXX 对象还存在,比较了该对象的创建时间,和语句的报错时间,确实是先创建再报错。

7 上述的 A1,B1,都是 TMPA 的别名,也就是,主表 TMPA 自己 MERGE 自己。

8 由于数据库启用了回收站功能,存在几十万被删除的对象,最多的就是上面提到的 TMPXXXXX 之类的表。

9 考虑到回收站里的对象无意义,于是执行 PURGE DBA_RECYCLEBIN,清除之。

10 奇异事件发生了,大概只清除几万的回收站对象时,再去执行会计查询,发现完全正常了,也就是, 做任何月份范围的查询,都正常了。

11 显然,故障原因与回收站的垃圾对象有关。猜测,回收站里有几十万的垃圾对象,也就是,存在几十万的 TMPXXXXXX 对象,系统会不会在创建 TMPXXXXX 表时,和垃圾站里的某个对象同名,创建不成功,因此使用了早期的对象,而该对象由于是早期创建的,缺少 B1.XXX 字段,因此出现此错误。

12 但此推论我都不认可,1 不说垃圾站里的对象,不会与新建的 TMPXXXXX 在名称上有冲突,2 在上面。第6条时,已经说了,对象确实是应用系统刚刚创建,创建后再报错,时间顺序上是吻合的,

13 但若不是此道理,为何清除垃圾站后,查询就OK了?

如果你在冲顶解决问题中一筹莫展了

别放弃

来2018数据库技术大会充充电吧

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180112B0EA9500?refer=cp_1026

扫码关注云+社区