首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >VC客户端无法登陆都是REDO日志惹的祸

VC客户端无法登陆都是REDO日志惹的祸

作者头像
孙杰
发布2019-10-29 12:35:34
8720
发布2019-10-29 12:35:34
举报
文章被收录于专栏:云技术+云运维云技术+云运维

环境:VSPHERE5.5+独立oracle 11G数据库

现象:打开vcenter服务器控制台,输入密码后卡在欢迎界面无响应,客户端也无法正常登陆。

wKioL1ee4QDRBnqeAAEFBd1mKqo938.jpg
wKioL1ee4QDRBnqeAAEFBd1mKqo938.jpg

正常重启也不行。由于VC所在虚机为独立磁盘无法做快照,不能备当时状态。

查看所在WINDOWS系统日志发现硬件可能有问题。

wKioL1ee4WyxRSvlAAGWme2gTs8177.jpg-wh_50
wKioL1ee4WyxRSvlAAGWme2gTs8177.jpg-wh_50

这是偏移量,并不能代表硬件有问题,怀疑VC连接的数据库有问题,逐登陆排查。 1、登陆11.15.146.2

首先查看数据库进程,正常。

wKioL1ee4cCjfc0aAAWiUNM6dFU615.jpg-wh_50
wKioL1ee4cCjfc0aAAWiUNM6dFU615.jpg-wh_50

2、查看数据库的告警日志,发现一个问题。

wKioL1ee4lWCrpd9AAGg4StEW14432.jpg-wh_50
wKioL1ee4lWCrpd9AAGg4StEW14432.jpg-wh_50

这个实际上是个比较常见的错误。通常来说是因为在日志被写满时会切换日志组,这个时候会触发一次checkpoint,DBWR会把内存中的脏块往数据文件中写,只要没写结束就不会释放这个日志组。如果归档模式被开启的话,还会伴随着ARCH写归档的过程。如果redo log产生的过快,当CPK或归档还没完成,LGWR已经把其余的日志组写满,又要往当前的日志组里面写redolog的时候,这个时候就会发生冲突,数据库就会被挂起。并且一直会往alert.log中写类似上面的错误信息。

分析原因: 服务器有三个日志组g1、g2、g3.当g1写完时,要往g2上写,这时候g1要进行归档,还要进行checkpoint。然后另外两个日志组继续写。当g2和g3都写完之后,又要往g1上写,但是问题来了,g1还没有完成归档和checkpoint操作。所以这时就会报警。 解决方法: 多加几个日志组,并且每个日志组空间大一点,这样就可以延缓时间,会留给g1充分的时间来完成归档和checkpoint任务。就不会有报错。

操作步骤:

首先查看下数据库的日志组状态

查看在线日志组:SQL> select * from v$log;

查看日志组中的成员:SQL> select * from v$logfile;

查看日志组的具体状态:SQL> select group#,sequence#,bytes,members,status from v$log;

    GROUP# SEQUENCE#      BYTES    MEMBERS   STATUS

------------------------------------------------

         1     28825   52428800  1     INACTIVE

         2     28826   52428800  1       ACTIVE

         3     28827   52428800  1       CURRENT

CURRENT: 表示是当前的日志。

INACTIVE:脏数据已经写入数据块。该状态可以drop。

ACTIVE: 脏数据还没有写入数据块。

日志只有50M太小

扩充下日志组大小

SQL> alter database add logfile group 4 ('/u01/app/oracle/oradata/pvdb/redo04.log')size 500M;

Database altered.

SQL> alter database add logfile group 5('/u01/app/oracle/oradata/pvdb/redo05.log') size 500M;

Database altered.

SQL> alter database add logfile group 6 ('/u01/app/oracle/oradata/pvdb/redo06.log')size 500M;

Database altered.

切换日志组

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

注意:alter system switch logfile 和alter system archive log current这两个切换的区别。

alter system switch logfile 是不等待归档完成就switch logfile。如果database尚未开启archive log mode。那用这个切换是毋庸置疑了。另外,也是对单实例database和RAC模式下当前实例执行日志切换。

而alter system archive log current则需要等待归档完成才switch logfile。会对其中所有实例执行日志切换。

整体上说来,在自动归档的库里,两个命令的所产生的结果几乎一样。有区别的是alter system archive log current所用的时间会比alter system switch logfile 的长。

 删除日志组

SQL> alter database drop logfile group 1;

Database altered.

SQL> alter database drop logfile group 2;

Database altered.

SQL> alter database drop logfile group 3;

Database altered.

注意删除日志组及日志组成员:

原则:删除前必须遵守如下原则,每个实例必须至少有两个日志组;当一个组处于ACTIVE或者CURRENT的状态时不可删除;删除日志组的操作只对数据库进行更改,操作系统的文件尚未删除;当删除时适用DROP LOGFILE GROUP N语句时,此时GROUP N内的所有成员都将被删除。

ALTER DATABASE DROP LOGFILE GROUP N;

日志组状态的改变:

SQL> select group#,sequence#,bytes,members,status from v$log;

    GROUP#  SEQUENCE#      BYTES    MEMBERS STATUS

---------- ---------- ---------- ---------- ----------------

         1     201268 2147483648          1 CURRENT

         2     201263 2147483648          1 ACTIVE

         3     201264 2147483648          1 ACTIVE

         4     201267  524288000          1 ACTIVE

         5     201265  524288000          1 ACTIVE

         6     201266  524288000          1 ACTIVE

SQL>  ALTER SYSTEM CHECKPOINT;

SQL> select group#,sequence#,bytes,members,status from v$log;

    GROUP#  SEQUENCE#      BYTES    MEMBERS STATUS

---------- ---------- ---------- ---------- ----------------

         1     201268 2147483648          1 CURRENT

         2     201263 2147483648          1 INACTIVE

         3     201264 2147483648          1 INACTIVE

         4     201267  524288000          1 INACTIVE

         5     201265  524288000          1 INACTIVE

         6     201266  524288000          1 INACTIVE

删除日志成员的原则:当你删除一个是该组中最后一个成员的时候,你不能删除此成员;当组的转台处于current的状态时,不能删除组成员;在归档模式下,必须得归档之后才能删除;删除日志组成员的操作只对数据库进行更改,操作系统的文件尚未删除。

删除日志组后再删除相应日志文件,例如redo01.log

SQL> !rm  /u01/app/oracle/oradata/pvdb/redo01.log

SQL> alter system switch logfile;

System altered.

SQL> select group#,sequence#,bytes,members,status from v$log;

   GROUP#  SEQUENCE#      BYTES   MEMBERS    STATUS

------------------------------------------------

        4      28828  524288000          1     INACTIVE

        5      28829  524288000          1     ACTIVE

        6      28830  524288000          1     CURRENT

最后切完日志组后,观察新建的REDO日志组已被应用,数据库正常,数据库日志再无报警,问题解决。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016-08-01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档