前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >排查线上 Linux 系统故障,看这一篇就够了!

排查线上 Linux 系统故障,看这一篇就够了!

作者头像
编程珠玑
发布2021-03-03 14:42:21
9550
发布2021-03-03 14:42:21
举报
文章被收录于专栏:编程珠玑编程珠玑

之前分享过部分性能优化相关的文章,不过暂不成体系。但是不论你去面试高级工程师,还是架构师,性能优化的问题一定少不了。想彻底解决性能问题,就要全面了解程序设计、算法分析、编程语言、系统、存储、网络等方面知识。

但真正能做到的人少之又少,比如,这些问题估计你也遇到过:

  • 流量高峰期,服务器 CPU 使用率过高报警,是系统 CPU 资源太少,还是程序并发部分写的有问题?
  • 系统并没有跑吃内存的程序,但敲完 free 命令后,却发现没有内存了,到底是哪里占了内存?
  • 一大早就收到 Zabbix 告警,发现某台存放监控数据的数据库主机 CPU 的 I/O Wait 较高,该怎么处理?

大多数时候,我们只能看到“症状”,却不知道从哪儿下手排查和解决。因为 Linux 性能优化是个系统工程,除了要掌握那些基础知识,还有 2 点特别重要:

1、尝试大量 Linux 性能工具,学习性能优化的思路和方法;

2、不断的实践和总结,通过丰富的踩坑经历,将性能问题和系统原理关联起来,特别是将应用程序、库函数、系统调用、内核和硬件等不同的层级连接起来。

学习要会抓重点,只要你了解几个系统组件的原理和协作方式,掌握基本的性能指标和工具,学习实际工作中性能优化的常用技巧,就可以准确分析和优化大多数的性能问题了。在这个认知的基础上,再阅读那些经典书籍,才能事半功倍。

为你分享一张思维导图,涵盖了大部分性能问题,你可以借此对性能有个全面的认识。

这张图谱出自倪朋飞,他是微软资深工程师,有 10 年云计算工作经验,主要负责开源容器编排系统 Kubernetes 在 Azure 的落地实践。

先别急,看下去,因为这个专栏质量确实不错。

我自己也订阅了他的专栏《Linux 性能优化实战》。大概有 60 讲,讲解了 Linux 性能的基本指标、工具,以及相应的观测、分析和调优方法,用实际案例贯穿了从应用程序到操作系统的各个组件。专栏的整体质量比较高,内容比较硬核,介绍的内容除了针对性能优化之外,对于解决很多Linux下的疑难杂症也非常有帮助,这一点你可以通过试读和浏览目录快速了解到。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 编程珠玑 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档