首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

故障诊断:DRM导致Oracle RAC节点Hang

故障现象 在我们维护的一套系统上,某一时刻业务部反应业务无法正常进行,系统hang。 当时查看alert日志,结果如下: ? 在01:19的时候实例1连接中断,01:29实例1恢复正常。...从收集的信息资料来看,数据库实例因为DRM而hang的现象和BUG12998795基本匹配。但是SR中并没有明确给出确定的BUG号。...分析如下: 1、数据库alert告警日志中失去连接响应前的告警日志: ?...为什么checkpoint没有完成从而造成了数据库hang? 抓取了1点到2点的AWR报告,发现两个节点的topevents都是“enq: SQ - contention”如下图所示: ?...ID 12998795.8) SR中最终迟迟没有定论,需要等到下次数据库hang的时候,做hang anlyze然后分析dmp文件才能下结论。

1.7K40

按图索骥:Oracle数据库无响应故障的处理思路和方法

还有值得注意的是,即使是少部分会话Hang,也要及时处理,否则极有可能会扩散到整个系统。 2. 单个数据库实例Hang 这种情况造成的影响非常大。...日常维护不当、不正确的操作引起数据库Hang 比如归档日志的存储空间满,导致数据库不能归档,引起数据库Hang;在一个大并发的繁忙的系 统上,对DML操作比较多的大表进行move、增加外键约束等操作也可能使系统在短时间内负载大幅升高...对于数据库Hang故障的处理,首先是尽可能地收集到系统Hang时的状态数据,然后尽快地恢复业务,恢复业务后分析收集到的数据,找到数据库系统Hang的真正原因,然后再进行相应的处理。...有时一个细小的变动就可能导致出现数据库Hang这样严重的故障。曾经遇到一个库,应用只是修改了一个SELECT语句就导致了数据库Hang。 2....出现异常应立即处理;监控归档空间和日志切换;监控数据库中的等待事件,比如是否有大量的enqueue、log file switch (archiving needed)、resmgr:become active

1.8K80

分布式 | ddl 失败在 dble 中排查过程

---- 思考一个问题: 当我们用 dble 执行一个 ddl hang 时,我们该如何下手,如何找到这条 ddl hang 的原因?是我们自己的操作导致还是踩中了 dble 的 bug ?...下面我们从一个简单的场景着手来分析这个问题: 场景:对 shanging_4_t1 这张表执行 alter,结果 hang 住了 ? 分析第一步:查看 dble 日志看是否有报错? ?...分析第二步:查看这个日志的上下文,找出这个阶段 dble 都做了什么,问题可能出现在哪个阶段? 如果日志信息比较多,我们可以简单删选一下。 命令:less dble.log|grep DDL ?...分析到这一步,我们大概已经知道该 ddl 执行 hang 的原因了,是因为其中一个节点上该语句的在等待锁的释放,无法成功返回结果。...观察 dble 日志,查找是否有相关的报错或告警。 2. 查找报错或告警的上下文,简单的理解 dble 的处理机制,找到该问题出现的环节。 3. 根据日志提示进一步到对应节点上查找原因。

39010

linux日志循环

linux存在很好的日志机制,大到系统,小到应用都可以记录日志。 为什么需要日志循环 操作系统(Windows,Unix),应用一般都会记录日志,方便使用者常看系统或应用使用情况,或者排查故障。...单纯的记录日志不加干预,日志不断累积,时间长了,磁盘空间就被占满了。 所以,在linux中,日志一般会按一定的规则进行循环,保证日志量控制在一定的范围内。...日志循环的方法 日志循环的原理一般是:在特定的时间点,或日志达到一定大小,就触发循环脚本。 循环脚本通过新增新日志,备份老日志,调度应用重新加载配置(重新写日志)达到日志循环的目的。...}` 该方法通过mv+kill的方式进行日志循环,因为linux中,日志打开底层原理是通过inode信息寻址找到对应的block进行内容读取,mv操作不改变文件的inode值。...2. logrotate循环 logrotate是一个日志循环的工具,linux内置的syslog也是使用它进行日志循环。

4.1K50

Linux 日志管理

# Linux 日志管理 # 基本介绍 日志文件是重要的系统信息文件,其中记录了许多重要的系统事件,包括用户的登录信息、系统的启动信息、系统的安全信息、邮件相关信息、各种服务相关信息等。...原理示意图 查询Linux中的rsysloged服务是否启动 ps aux | grep "rsyslog" / grep -v "grep" 查询rsyslogd服务的自启动状态 systemctl...sshd服务相关事件),该文件会接收到信息并保存.给小伙伴演示重启,登录的情况,看看是否有日志保存 # 日志轮替 # 基本介绍 日志轮替就是把旧的日志文件移动并改名,同时建立新的空日志文件,当旧日志文件超出保存的范围之后...这样日志文件名不会重叠,也就不需要日志文件的改名,只需要指定保存日志个数,删除多余的日志文件即可。 如果配置文件中没有“dateext”参数,日志文件就需要进行改名了。...missingok 如果日志不存在,则忽略该日志的警告信息 notifempty 如果日志为空文件,则不进行日志轮替 minsize 大小 日志轮替的最小值。

5.4K30

linux日志管理

为了让 管理者可以随时监控服务所产生的信息,Linux 提供了一个日志服务,该服务可以收集(Collect)任何服务传递过来的信息,储存成为记录文件(Log File) 、或直接传送给某些用户,甚至也可以传送到其他计算机的系统日志服务...日志的作用 ​系统方面的问题 ​linux系统长时间运行,可能会出现一些软件,硬件方面的问题,这些问题都会记录到日志文件中,我们可以通过查看相应的日志文件,找出问题所在 网络服务的问题 ​网络服务在运行过程中产生的信息都会记录到日志文件中...所以linux系统提供了一个日志切割工具,这个工具就是logrotate,用户可以用过这个工具对日志文件进行切割,系统也利用这个工具配合计划任务服务,定期的对系统日志进行切割。...现在linux系统采用systemd来管理系统服务,而systemd又是第一个启动的服务,所以现在我们通过一个systemd自带的,名字叫systemd-journald的服务来协助记录日志信息。...虽然我们有相关的工具来查看日志信息,但是如果信息量过大的话查看起来也是比较费时的,所以linux系统给我们提供了一个日志分析工具,这个工具叫logwatch,它会每天分析日志信息,并将信息通过邮件的形式发送给

1.4K20
领券