首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据库服务器主机重启故障诊断分析

摘要:某客户RAC数据库服务器主机轮流发生集群与主机重启,数据库连接不上问题,如下为故障诊断思路....一、故障现象: 告警日志: Sun Feb 09 14:18:42 2020 Auto-tuning: Shutting down background process GTX2 Sun Feb 09...分开始 ocr_vote磁盘离线,一节点被剔出集群, 后续检查主机,发现主机重启过,检查操作系统日志,发现从15.02分开始,: INFO: task ocssd.bin:16080 blocked...IO系统响应缓慢,导致越来越多的请求堆积,最终IO 耗尽,系统内存全部被占用,导致系统失去响应,发生故障。...建议二: 另外在检查中,发现该主机未配置大页,建议配置大页,可以极大提升数据库性能 后期调整后至今没有发现主机重启故障解决。

1.8K00

数据库服务器主机重启故障诊断分析

墨墨导读:某客户RAC数据库服务器主机轮流发生集群与主机重启,数据库连接不上问题,如下为故障诊断思路。...一、故障现象 告警日志: Sun Feb 09 14:18:42 2020 Auto-tuning: Shutting down background process GTX2 Sun Feb 09 15...从数据库告警日志可以发现,核心进程asmb 在2.9日15.06分 突然提示正在终止,随后一节点数据库报错,不能与 ASM通信, 也就是连不上 ASM存储,检查ASM告警日志发现,核心进程ASMB 在2.9...后续检查主机,发现主机重启过,检查操作系统日志,发现从15.02分开始,: INFO: task ocssd.bin:16080 blocked for more than 120 seconds....建议二: 另外在检查中,发现该主机未配置大页,建议配置大页,可以极大提升数据库性能 后期调整后至今没有发现主机重启故障解决。

1.9K10
您找到你想要的搜索结果了吗?
是的
没有找到

一次服务器非法重启后导致的故障排查记录

前段时间遇到一个服务器问题:非法重启设备后,服务器进入救援模式,数据盘也不显示挂载是否成功。 说来这个问题,我觉得还挺奇葩。今天就来跟大家分享下整个过程以及我的处理方法。...还好服务器有配置远程管理地址,通过远程控制管理页面的方式启动 iKVM HTML5 和远程管理服务器,这样就能登到这台出故障的设备上查看服务器界面处于一种什么样的状态。...登到这台故障服务器后,直接重启服务器,然后 Xshell 再次尝试连接,是可以远程连接的。难道这就是传说中的重启治百病,如此简单粗暴? 当进入系统后,执行简单的命令都提示输入/输出错误。...到该模式下后, 输入journalctl -xb命令,可查看系统日志 输入systemctl reboot命令,重启系统 输入systemctl default或^D命令,再次尝试进入默认模式 输入 root...当如果重启设备,能看到如下界面,则说明正在初始化设备。 恰巧,这台故障服务器有多块硬盘组成的 44T 的一个目录有存放 46% 的数据,在有数据的情况下,如何不格式化磁盘重新挂载呢?

1.2K30

设备故障重启的3种方式

前言 当网络设备故障时,重启设备可能会让故障消失。...下面介绍3种常用的重启方式: 通过断电重启; 通过命令行重启; 短时间(不足5秒)按住RESET键,进行重启; 1 断电重启 先将设备下电,然后重新给设备上电。...冷重启通过手工重启设备,比较有局限性,适用于现场维护人员。 重启时,设备将不保存当前配置直接重启,请注意提前保存配置。 2 命令行重启 在用户视图下执行reboot命令。...热重启通过命令行重启设备,适用于远程管理设备的维护人员。 重启时,系统会提示用户是否保存配置,有效防止配置丢失。 ‍3 RESET重启 按住RESET键重启。...重启时,设备将不保存当前配置直接重启,请注意提前保存配置。 如果对你有用,帮忙点个在看+点赞+转发吧,如果有什么想法,请在评论区留言!

1.4K20

如何设置服务器自动重启 服务器自动重启怎么解决

网站管理除了每天要注意漏洞的产生外,服务器的管理也是很有必要的,网站能否顺利平稳的使用,全靠服务器的支撑。服务器需要进行定期的重启才能避免死机情况的发生。下面就跟大家讲讲如何设置服务器自动重启?...image.png 如何设置服务器自动重启 如何设置服务器自动重启?...想要网站减少漏洞的产生,避免其他病毒的入侵,就要学会定期给服务器重启操作,在此建议大家两三个星期就要对服务器重启一次,最好不要超过三个星期。...重启的方法也很简单,有很多参数,大家只需记住重启的参数/t,这是关闭或者重启计算机的参数,打开电脑的命令控制台输入/t,就可以进行服务器重启。...服务器自动重启怎么解决 细心的小伙伴会发现自己网站的服务器会进行自动重启,想要解决这个问题就要从根源上找出问题,首先是进行排查,看服务器是否资源不足。

13.3K20

Percona XtraDB Cluster集群节点重启故障转移

因此,在2节点集群中无法实现安全的自动故障切换,因为一个节点的故障将导致其余节点变为非主节点。...因此,对于自动故障转移,建议使用3s规则。它适用于各种级别的基础架构,具体取决于集群散布多远以避免单点故障。...2、恢复非主集群 需要注意的是,3s的规则仅适用于自动故障转移。如果是双节点集群(或者在其他一些中断使少数节点处于活动状态的情况下),则一个节点的故障将导致另一节点成为非主节点并拒绝操作。...但是,只有当您确定没有其他分区在主服务器上运行时才能执行此操作,否则Percona XtraDB Cluster将允许这两个分区发生分歧(并且最终会生成两个不可能重新分区的数据库自动合并)。...如果已执行灾难恢复故障转移,则可以让辅助数据中心使用单个命令引导自己,但灾难恢复故障转移仍在您的控制之中。

1.4K20

故障分析 | MySQL 从机故障重启后主从同步报错案例分析

故障现象 MySQL 从库所在主机故障重启后,sql_thread 线程报错: root@3306 (none)> show slave status\G -- 摘取有用信息如下: Slave_IO_Running...故障分析 主机重启前,主从同步正常,主机重启后,主从同步由于主键冲突报错,对比了冲突主键所在行记录在主从库是一致的,初步分析事务'471c2974-f9bb-11eb-afb1-52540010fb89...:88313207'在主机故障前已经在从库进行了回放,那为何事务会重复回放呢?...Executed_Gtid_Set 来源于 gtid_executed 变量,gtid_executed 变量持久化介质有 mysql.gtid_executed 表和 binlog 日志,其中 mysql.gtid_executed...带参数 slave_skip_errors=1062 重启 MySQL 待主从同步正常后,再取消参数 slave_skip_errors 设置重启 MySQL 。

83410

故障分析 | MySQL clone 自动重启失败的解决方式

但是在进行 clone 操作的过程中,当拉取数据完成并进行自动重启 server 时,总是会出现重启失败的现象,如: 日志报错提示 RESTART 失败,需要在后面手动重启,错误代码3707,即:ERROR...而当出现相关报错时也不用担心,并不能说明 clone 失败了,随后只需要手动重启就可以了。 通过上面的日志和官方文档我们得到了出现重启失败的两个线索:RESTART 、监控进程。...而官方设置的重启时机是“on-failure” , 即数据库当遇到异常宕机、进程中断信号或监控超时时就会进行重启,但是当数据库异常宕机时,有时我们并不想让数据库立刻自动重启,而是需要在运维和开发人员确认过问题之后进行手动重启...,这样就解决了 clone 自动重启失败的问题,同时也保证了数据库在其他异常情况下不会进行自动重启。...如给 MySQL 发送中断信号时不会自动重启: 当执行 clone 操作时可以自动重启 没有了之前的报错,进行自动重启 ----

1.4K20

腾讯云Windows重启与关机事件日志

二、重启 “右击”开始菜单—》关机或注销—》“重启” 或者 “更新并重启” EventID=1074 进程:C:\Windows\Explorer.EXE,用户Administrator,重启:其他(计划外...,重启:其他(计划外) 关机类型:重启 原因代码:0x0 通过PowerShell执行restart-computer重启 EventID=1074 进程:C:\Windows\system32\wbem...:Service Pack(计划内) 关机类型:重启 原因代码:0x80020010 安装完Windows自带功能角色,勾选了“如果需要,自动重新启动目标服务器” EventID=1074 进程:C:\...Active Directory 域服务 开启full dump等之后,点击“立即重新启动(R)” 会产生2条EventID 1074的事件日志。...如:安装完宝塔,点击“重启服务器” EventID=1074 进程:C:\Windows\system32\shutdown.exe,用户SYSTEM,重启:没有找到这个原因的标题 关机类型:重启 原因代码

8.2K30

如何收集设备日志用于故障定位

1 日志产生 在设备运行过程中,日志模块会对运行中的各种情况进行记录,形成日志信息。...生成的日志信息可以通过控制口或telnet方式显示日志内容,在设备上对日志进行保存,也可以使用syslog协议将日志信息输出到日志服务器。...syslog协议采用UDP的514号端口进行传输,任何在514端口上出现的UDP包都会被视为一条日志信息。 日志信息可以通过如下两种方式查看到: 通过网络管理系统界面直接查看日志信息。...2 收集日志信息 当设备出现故障时,收集设备日志信息,有助于用户了解设备运行过程中发生的情况,定位故障点。 日志信息主要记录用户操作、系统故障、系统安全等信息,包括用户日志和诊断日志。...用户可通过如下方式获取用户日志和诊断日志信息: save logfile //收集普通用户日志

76820

MySQL日志故障的处理和分析

这是学习笔记的第 1796篇文章 有一台预上线的服务器最近在做压力测试,也引发了一系列的相关问题,排查思路可以提供参考。 问题的起因就是收到同事提醒,根据监控报警提示,磁盘空间满了。...change size of file (Errcode: 28 - No space left on device) 碰到这类问题,直观的思路就是查看分区下最大的文件,当然如果足够智能,也可以启用前几天提到的故障自愈的实现思路...这种情况该怎么做,释放句柄最好的一种方式就是重启,但是显然这不是一个好的方法,有些简单暴力,有没有更好的方案呢,我们来看看满日志相关的参数。...,达到释放句柄的目的,然后再次重启开启。...data/audit.log (deleted) 但是很明显这个进程就是MySQL服务的进程号,直接kill MySQL实在是太暴力了,而且这个测试还在进行中,为了避免不必要的解释和麻烦,我们也是不能重启数据库的

65230

服务器如何重启?云服务器重启和正常电脑有哪些不同?

服务器目前在市场上非常受用户的欢迎,很多朋友都开始使用这种高效低价的产品来处理各种工作任务,但云服务器在长时间使用后也会出现卡顿的现象,很多朋友都想要通过重启来解决问题,那么云服务器如何重启?...云服务器重启和正常电脑有什么不同呢?...云服务器如何重启 现在已经有很多朋友都开始使用了云服务器产品,但习惯了使用家用电脑的用户,在需要对云服务器进行重启时往往不知道如何操作,甚至不少朋友认为云服务器是不可以在客户端重启的。...其实云服务器也是可以重启的,用户只需要在云服务器中寻找控制台的ECS功能,就可以在里面寻找到重启的选项。...云服务器重启区别 习惯使用家用电脑的朋友在初次使用云服务器时往往都比较好奇,对于云服务器如何重启这个问题都非常感兴趣,并且希望知道云服务器重启和家用电脑重启有什么区别,其实家用电脑重启直接在桌面点击开始就可以找到重启菜单

14.8K20

服务器故障邮件报警

说到服务器硬件监测,用得最多的自然是Zabbix和prometheus,可是对于一般用户来说,部署要求比较高,而且也没有必要。...只是监测服务器硬件故障,并且发生问题的时候,以邮件形式告警,那么服务器自带的功能就足以。 比如戴尔服务器的idrac,配置硬件故障的邮件告警就非常简单。...如上图所示,首先填写邮件发送服务器的地址,其次就是填写发件人邮件地址,然后就是SMTP端口号,采用SSL协议的话,端口号就填写465;最后填写用户名和密码,就是发件人的邮件账号和密码。...收件人邮件地址,当然也需要填写,不然故障报给谁呢?然后可以“发送”测试邮件,一般都是秒收,如果没收到,就检查SMTP配置。...我比较关注系统运行状况和存储,尤其是存储,重要的数据都在硬盘里面呢,其他硬件故障,相对来说,没那么重要,电源坏了,可以换,内存坏个一两条,也无伤大雅。硬盘要是坏了,那就损失大了。

21630
领券