展开

关键词

无奈的 (r7笔记第20天)

最近真是忙的厉害,感觉时间都不是自己的了,大周末的时间都排得满满当当,先是大半夜接到报警电话,接着碰到了让人无奈的问题,一台服务器挂掉,结果上面有两个备库,都是数据量庞大的统计分析库,数据量也不小, 最后也是一波三折,初步分析是盘问题,结果换了盘之后,今天凌晨问题再次发生# cd MegaCli-bash: cd: MegaCli: No such file or directory# llls 搭建的备库需要做ASM到普通文系统的映射,在这一点上还是有些顾虑,不知道Oracle能不能处理好。 但是如果单映射文系统,就会发现日志中有这么一段内容。看来这file_convert方面还是做得不错。 很头疼,但是也还是需要提前进行排查。等这个问题处理之后再细化监控。还有就是要好好补补知识。

36930

电脑常见维修技巧

电脑已经成为我们学习日常生活娱乐必不可少的设备了,时间久了难免会遇到小,今天我们一起来看下遇到常见的电脑方面的小,我们应该如何去自己检测和维修吧。? 电脑检测我们还是要从电脑的几大开始检查起。 1、CPU? 5、盘? 盘出现问题时电脑的速度变得“奇卡无比”,特别的慢,而且是从开机就明显比原来慢很多,开机时间甚至超过2分钟,如果重装系统后依旧,多数是盘中招了,机械盘出现物理坏道时还会出现的“咔咔”声。 请将重要文拷贝出来以后,直接更换盘,对于大多数人来说修复盘的成本远远大于更换盘,所以平时做好资料的备份工作是很重要的,盘出现问题大多数情况是因为盘在高速运转时主机受过外力的影响或突然断电造成

13410
  • 广告
    关闭

    最壕十一月,敢写就有奖

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    修复 原

    修复,具体过程如下:排查根据告警信息进行定位:? 定位:请求支援到底如何定位问题所在呢???答案只有一个:日志!日志太多了,看哪些? 对一窍不通的我只能请求支援——Dell服务器技术支持(https:www.dell.comsupporthomecnzhcnbsd1)。 完成日志采集后将日志文发送给技术支持(对方会提前邮和你联系)。定位:剧终! 数据备份及服务迁移检查当前服务器信息进行迁移和备份之前首先要做的就是清楚当前服务器的情况,主要由以下几项:信息:CPU、mem、磁盘(大小、raid级别、分区状况)等等;防火墙:iptables -

    34620

    服务器预测实践

    在这些中“贡献”最多的当属盘了(如图1所示),它在服务器部中占比高达70%以上,这也归结于它的体量最大,并且生命周期比较短(如表1所示),盘的生命周期一般只有3到5年。 我们的服务器使用年限超过5年后,率都是非常高。?于是乎,想快速有效的降低服务器的影响,核心就在于降低的影响。 另外实际单更多的侧重于依赖OS层面的判断,把部分能捕捉到的问题暴露了出来,其实一定程度上漏掉了一些健康堪忧但并未报盘,也就是说本身当前最原始的健康状况被忽视了。 成功预测的数量,粗略估算已覆盖SATA数的50%左右,进而促使5年以上服务器对业务影响的整体率也下降了0.5%。 当然,我们也会与服务器厂商和设备供应商一起紧密合作,在FW和介质底层更深入的分析失效的原理,对持续降低率发起挑战。

    4.4K90

    病毒与:漫谈计算机软应对

    当然,本文并不是谈及新型冠状病毒和《病毒星球》,而是将和病毒进行类比,聊一聊计算机软应对机制,而其中关于病毒相关科普性的资料和数据来自于《病毒星球》一书。 一、:潜伏于计算机软的病毒 人鼻病毒作为普通感冒和哮喘的罪魁祸首,是人类广泛存在的老朋友。鼻病毒巧妙地利用鼻涕来自我扩散。 (摘自《病毒星球》)也与之类似,它就好似生命体的 DNA 片段缠绕于计算机软中,无法割舍。 而面对,虽然它的底层导火索可能就只有哪几种,但是由于技术的复杂性和业务的复杂性导致了计算机软的整体复杂性。 图片来自互联网总结一下,就像潜伏于计算机软的病毒,由于技术的复杂性和业务的复杂性导致了其排查和解决的困难性,我们可以采取监控、告警、预案,以及演练提早发现并解决

    17110

    病毒与:漫谈计算机软应对

    当然,本文并不是谈及新型冠状病毒和《病毒星球》,而是将和病毒进行类比,聊一聊计算机软应对机制,而其中关于病毒相关科普性的资料和数据来自于《病毒星球》一书。 一、:潜伏于计算机软的病毒 人鼻病毒作为普通感冒和哮喘的罪魁祸首,是人类广泛存在的老朋友。鼻病毒巧妙地利用鼻涕来自我扩散。 (摘自《病毒星球》)也与之类似,它就好似生命体的 DNA 片段缠绕于计算机软中,无法割舍。 而面对,虽然它的底层导火索可能就只有哪几种,但是由于技术的复杂性和业务的复杂性导致了计算机软的整体复杂性。 图片来自互联网总结一下,就像潜伏于计算机软的病毒,由于技术的复杂性和业务的复杂性导致了其排查和解决的困难性,我们可以采取监控、告警、预案,以及演练提早发现并解决

    15710

    时如何强制关机:Inputoutput error

    如果盘可能会出现锁死或坏道的,会造成 SHELL 命令的失效,包括 reboot,powoff,,shutdown,用正常的命令是没法完成重启的。 rebootbash: sbinreboot: Inputoutput error# shurdown -r nowbash: sbinshutdown: Inputoutput error很明显,因为盘的 下次启动时系统自动 fsck 可能会更正磁盘错误,但首先需要使系统重启,拉掉电源这个办法可能会造成盘的伤害。 可以让内核直接重启,不需要读取(已经锁死或坏掉的)盘,如下:1、执行:echo 1 > procsyskernelsysrqmagic SysRq key提供了一个通过proc 来直接给内核发送命令的方法

    89240

    systemx3650 m5 raid 1 两块盘掉线回顾

    due to a detected fault 目前大多数控制器的实现是将RAID信息同时记录在控制器与盘上,这样当两者中有一出,可通过另一份COPY还原。 修复步骤由于现场条有限,没有拍照记录,参考官方文档介绍修复思路开机后,注意引导界面,按F1键进入BIOS进行设置进入BIOS后,选择system setting--storage ,进入磁盘阵列配置界面 Storage;会出现SAS RAID卡配置项,如下图中的ServeRAID M5210;接下来即进入UEFI HII SAS RAID阵列配置界面,下图为Dashboard界面;旧版本SAS RAID卡固没有 Hardware Components是查看、调整RAID卡部设置十一、修复掉线的盘本节介绍修复如在服务器运行中因误拔插所致的单一盘掉线的操作。 盘掉线会在盘托架上亮黄灯(不论是正常盘因误插拔掉线还是),此时对于非RAID0阵列则会处于Degrade状态或者Partial Degrade状态。

    7220

    分析 | Kubernetes 诊断流程

    一、本文概述及主要术语1.1 概述本文基于 Pod 、Service 和 Ingress 三大模块进行划分,对于 Kubernetes 日常可能出现的问题,提供了较为具体的排查步骤,并附上相关解决方法或参考文献 二、诊断流程2.1 Pods 模块检查以下流程若成功则继续往下进行,若失败则根据提示进行跳转。 2.3.5 检查能否在外网通过 Ingress 进行访问可从外网成功访问,排查结束。

    5720

    事中处理(4)定位

    恢复指恢复业务连续性的应急操作,很多是在不断尝试验证解决恢复的动作,所以恢复环节与定位环节有一定的交叠,或在这两个环节之间不断试错的循环,即恢复操作可能和诊断是同时,也可能是诊断之后或诊断之前 大部分都是变更带来的,一方要将涉及变更的软发布、数据维护、参数维护等行为线上化或自动化,提供针对变更的回切工具;另一方面要将变更行为数字化,当时能够让运维专家快速获知变更行为,并针对变更行为进行线上化回切 在具体的架构高可用性上,我认为对于核心与重要业务的平台或业务系统应该首先基于“不可修复系统”的思路,强调在设计、部署层面即要高可靠,比如在网络、安全、存储、、数据库等层面的保证高可用,以及在负载均衡 ,比如围绕CD构建的软发布与回退功能提升软发布层面的应急恢复,提供数据维护、参数配置工具、切换场景工具,以及高效的跨团队协同等自动化或线上化工具。 4.恢复后信息传递虽然从MTTR角度看,恢复通常以技术指标的恢复为判断条,但是在实际的处置过程中,恢复结束的判断条通常是验证与信息通报。验证包括技术验证与业务验证。

    9030

    Linux文系统,Inputoutput error

    之后怀疑是磁盘出现问题,根据网友的解决方案尝试之后发现,这个方法可行,下文是命令及回显: 使用ls命令查看的时候出现这个报错 # ls datals: 无法访问data: 输入输出错误# 这个是xfs的文系统 查看一下这个磁盘是否可以正常使用 # cd datavm# lsCentOS7-Clone-1 CentOS7-Clone-3 CentOS7-Clone-4 CentOS7-Clone-5 CentOS8 Ubuntu此刻文系统已修复完毕 注意: 修复其他文系统使用fsck命令进行修复 例如ext4文系统 fsck -t ext4 -y devsda1不同的文系统,命令会有些许不同,灵活变通一下

    13730

    3.4 事中处理(3)定位

    定位指诊断直接原因或根因,定位有助于恢复动作更加有效。定位通常是整个过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。 已知预案指提前对场景进行描述,并制定应急操作步骤。在预案的启动中,我们做了几事:预案线上化。线上化的预案主要解决当前线下文档式预案不可用、不好用的问题。 性能管理,AIOps等场景的工具应用,将有利于研发团队在定位环节,提升代码分析能力。2.定位工具:1)日志对于运维而言,日志是运维了解及软内部逻辑的一面窗口。 日志记录了从业务、中间、系统等全链路信息,可以有效监控IT系统各个层面,从而有效的调查系统,监控系统运行状况。 仅凭借管理员在海量日志中手动查看日志记录,需要登陆每一台服务器,一次次重定向文,操作繁琐,不利于定位。

    7220

    一次引发的基础架构改造

    昨天我们给一台 MD 存储进行盘扩容,不知道哪一步出了问题,服务器识别不到存储的数据卷了!这些数据千万不能丢啊,里面存放了近几年的设计图纸,整个设计部现在都要快瘫痪了! 客户为小 D 提供了如下诉求:① 客户计划在烟台总部以外的两个地市建立分支机构,每个地点都放置一台独立存储;② IT 和使用者习惯了基于 Windows NAS 的使用方式;③ 经历数据丢失的事后,数据保护方案提上日程 原来,小 D 在处理客户数据丢失事的同时,已经想到要为其提供一套改造计划了。 1DFS 实现分支结构文共享基于 Windows DFS(分布式文系统)架构搭建三地文共享访问系统,解决了客户总部、分支机构及 Remote 用户对文访问的需求;? RDC 检测对文中数据的更改,并使 DFS 复制仅复制已更改文块而非整个文。跨 LAN 或 WAN 网络连接,在服务器之间有效地同步文夹内容。

    25730

    # 恢复

    .* TO slave@% IDENTIFIED BY 123456;查看master状态和复制起始点show master status;# File为复制的文 Position为开始复制的接入点+ MASTER TO MASTER_HOST=127.0.0.1,MASTER_PORT=3307,MASTER_USER=slave,MASTER_PASSWORD=123456,# 主节点当前logbin文MASTER_LOG_FILE =mysqlbin.000001,# logbin文的偏移值MASTER_LOG_POS=682;开始复制start slave;查看连接状态show slave status G;# 下面两个同时为 通过配置文(不推荐) 只有确认某个主机永远不会执行写操作时才使用配置文设置为只读 read_only=1 12 通过sql命令(配合第一种方式使用) 该命令需要超级管理员才有权限执行,在自动切换主从时有用 set global read_only=1; 1 # 恢复如果master宕机后恢复 对新的master节点加全库只读锁,阻止所有写入操作,并计下master节点当前得binlog信息,然后备份数据并恢复到宕机得节点中

    15320

    分析 | MySQL OOM 应如何下手

    上面的“ a.out ” 表示我们要在其上运行 memcheck 的可执行文。此外还可以使用其他的命令行选项,以满足我们的需要。运行的程序结束后,会生成这个进程的内存分析报告。搞个测试找找感觉1.

    30820

    分析 | 记一次 MySQL 复制 -Error_code:1317

    作者:侯晓阳爱可生 DBA 团队成员,主要负责 MySQL 处理和 SQL 审核优化。对技术执着,为客户负责。本文来源:原创投稿问题背景MySQL 从库报错如下:?错误信息如下: ...

    11820

    redis记录

    Redis 未授权访问的问题是一直存在的问题,知道创宇安全研究团队历史上也做过相关的应急,今日,又出现 Redis 未授权访问配合 SSH key 文被利用的情况,导致一大批 Redis 服务器被黑, 利用 Redis 自身的提供的 config 命令,可以进行写文操作,攻击者可以成功将自己的公钥写入目标服务器的 root.ssh 文夹的authotrized_keys 文中,进而可以直接使用对应的私钥登录目标服务器 3、漏洞分析与利用首先在本地生产公私钥文: 1 $ssh-keygen –t rsa ? 然后将公钥写入 foo.txt 文 1 $ (echo -e nn; cat id_rsa.pub; echo -e nn) > foo.txt 再连接 Redis 写入文 1 2 3 4 5 6 这样就可以成功的将自己的公钥写入 root.ssh 文夹的 authotrized_keys 文里,然后攻击者直接执行: 1 $ ssh –i id_rsa root@192.168.1.11 即可远程利用自己的私钥登录该服务器

    50020

    MSDTC 排除

    在使用虚拟盘将一个操作系统部署到虚拟机上时,可能会发生这种情况。 如果计划通过复制和分发虚拟盘来部署 Windows,那么必须事先用 Sysprep 对所使用的虚拟盘中包含的 Windows 版本进行部署准备。

    51260

    Tomcat一例

    原因:tomcatbin下面缺少一个bootstrap.jar的文解决方法:官网重新下载安装即可。 你如果出现问题的包也是官网下载的,那么就尝试换个镜像重新下载,因为我出的包,也是官网下载的包出现的问题。

    46440

    排查】nginx504

    upstream timed out (10060: A connection attempt failed because the connected par...

    2.1K10

    相关产品

    • 智能硬件 AI 语音助手

      智能硬件 AI 语音助手

      腾讯云小微智能硬件 AI 语音助手(IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注云+社区

      领取腾讯云代金券