首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

日常管理(二)

读硬盘的速度 KB_wrtn/s 写硬盘的速度 #iostat x 1 (每隔一秒就会展现一次磁盘的IO状态) 我们重点关注的是 %util:如果长期大于50%代表着你的硬盘读写很厉害,代表着硬盘存在问题,有些故障...an 查看系统的网络连接状况 ESTABLISHED:客户端与服务端已经建立数据连接(并发连接数) TIME_WAIT:客户端与服务端连接还没有断开,处于等待的一个状态 LISTEN: 侦听状态 实用管理命令...++sta[$NF]} END {for(key in sta) print key,"\t",sta[key]}' 小扩展: 扩展tcp三次握手四次挥手(面试考点) tshark几个用法 ---- Linux...指定保存位置(但是我们保存的1.cap是不可以直接cat查看的) 如果不晓得一个文件是什么类型的文件可以使用 file /tmp/1.cap #tcpdump -r /tmp/1.cap -r: 读取 实用管理命令

3.5K60

Data Guard及ADG日常操作

Oracle Data Guard方面的内容 Data Guard作为Oracle提供的一个高可用及灾备解决方案,理解并可以实施它对于DBA来说是非常重要套的技能 前面我们已经介绍了如何假设物理备库,今天介绍日常如何维和如何开启...日常操作 3.1 关闭同步 SQL>alter database recover managed standby database cancel; 3.2 开启物理备库* SQL>startup nomount...故障处理 5.1日志无法传输到备库 查询V$ARCHIVE_DEST视图看是否有错误,并查看alert日志 一般有如下情形 tnsnames.ora配置不正确,请用tnsping查看是否能正确解析 LOG_ARCHIVE_DEST_n...至少需要处于mount状态 密码文件不一致,请重新拷贝主库文件至备库 5.2 备库无法mount 备库的控制文件不能是如下形式 操作系统备份的 没有用stnadby关键字备份控制文件 好了,到这里我们讲了DG日常的一些操作

1.8K10

【扯淡篇】故障的觉醒力?

,我们是认真的,故障,我们更是认真的。故障,真的是最好的老师,因此我才想写这篇文章! 最近互联网也是非常有意思,接二连三的发生故障,让我们一起先回顾一下。...如果广义的去看这个,我还会把它归结成问题。不过对于以上的故障,从的角度来说,我依然会说官方结论不够专业,希望内部不是这样的哈。...不断的审视我们的能力和IT的能力,说“故障最好的老师”的原因也在于此,它能够不断驱使我们走向更高的成熟度。...是复盘的首要负责人,复盘是为了找到根因(Root Cause),根因和故障现象不同,举个例子,故障现象是交换机故障,根因是因为技术架构没有对交换机故障做到容错,根因是对这种故障缺乏有效的临时应对机制...你们真的重视故障了么?你们真的重视了么?故障不能带来人的春天,从根本上去意识到的重要性,那才是人真正的春天。

65211

掌握必备技能--问题故障定位

同样对于内存有些概念需要清楚: 主存 虚拟内存 常驻内存 地址空间 OOM 页缓存 缺页 换页 交换空间 交换 用户分配器libc、glibc、libmalloc和mtmalloc LINUX内核级SLUB...要监测 IO 性能,有必要了解一下基本原理和 Linux 是如何处理硬盘和内存之间的 IO 的。...网络 7.1 说明 网络的监测是所有 Linux 子系统里面最复杂的,有太多的因素在里面,比如:延迟、阻塞、冲突、丢包等,更糟的是与 Linux 主机相连的路由器、交换机、无线信号都会影响到整体网络并且很难判断是因为...Linux 网络子系统的问题还是别的设备的问题,增加了监测和判断的复杂度。...目前供职于滴滴基础平台部-技术专家岗位,主要负责分布式Ceph系统。个人主要关注的技术领域:高性能Nginx开发、分布式缓存、分布式存储。 来源:简书,转载请联系作者获得授权

1.1K20

管理之线上故障处理原则

应急目标 在生成环境发生故障时快速恢复服务,避免或减少故障带来的损失,避免或减少故障对客户的影响 应急原则 应第一时间恢复系统,而不是彻底解决呢问题,快速止损 明显资金损失时,要第时间升级,快速止损 指标要围绕目标...对数据库的负载、慢查询、连接数等监控 对缓存的连接数、占用内存、吞吐量、响应时间等监控 消息队列的响应时间、吞吐量、负载、堆积情况等监控 定位问题 分析定位过程中先考虑系统最近发生的变化,需要考虑如下几方面 故障系统最近是否上过线...做了哪些事情,及时发生故障,也不会产生影响? 改进措施 根据回顾问题提出的改进措施,以正式的项目管理方式进行统一管理,采用 SMART 原则来跟进 参考 分布式服务架构原理、设计与实战

2.1K30
领券