专栏首页博文视点Broadview书单丨5本书感受运维技术的魅力

书单丨5本书感受运维技术的魅力

中国互联网发展非常迅速

尤其是在大数据复杂场景下

我们对运维有了新的期待以及更高的要求

NO. 1

《SRE生存指南:系统中断响应与正常运行时间最大化》

【美】Nat Welch 著

冯文辉 译

站点可靠性工程(SRE)专注于如何确保系统稳定、可靠地运行。本书基于一个金字塔层次结构模型,深入浅出地介绍了关于SRE的方方面面,涉及监控、事故响应与回顾、测试与发布、容量规划、开发、用户体验设计,以及贯穿其中的沟通技巧。

本书是SRE工程师、DevOps工程师、运维工程师和系统管理员不可或缺的参考资料;软件架构师、软件工程师、用户体验设计师也能从本书中获取关于SRE的相关知识。

NO.2

《SRE:Google运维解密》

【美】Betsy Beyer等 编著

孙宇聪 译

在本书中,Google SRE的关键成员解释了他们是如何对软件进行生命周期的整体性关注的,以及为什么这样做能够帮助Google成功地构建、部署、监控和运维世界上现存最大的软件系统。通过阅读本书,读者可以学习到Google工程师在提高系统部署规模、改进可靠性和资源利用效率方面的指导思想与具体实践——这些都是可以立即直接应用的宝贵经验。

NO.3

《混沌工程:Netflix系统稳定性之道》

【美】Casey Rosenthal 等 著

侯杰 译

Netflix官方出品,保障系统稳定性、确保架构弹性可伸缩的新方法!

本书介绍了 Netflix 的工程师团队是如何根据多年实践经验主动发现系统中脆弱点的一整套方法。这套方法现在已经逐渐演变成计算机科学的一门 新兴学科,即“混沌工程”。通过一系列可控的实验和执行实验的原则,混沌工程将揭示出分布式系统中随时发生的各类事件是如何逐步导致系统整体不可用的。

NO.4

《智能运维:从0搭建大规模分布式AIOps系统》

彭冬 朱伟 刘俊 等 著

直接来自新浪微博智能运维团队多年的探索与实践,技术思路可落地,解决方案有说服力。面向运维热点方向,详细分析底层原理,全面梳理技术体系,完整呈现从方法创新到工具化实践。

本书结合大企业的智能运维实践,全面完整地介绍智能运维的技术体系,让读者更加了解运维技术的现状和发展。同时,帮助运维工程师在一定程度上了解机器学习的常见算法模型,以及如何将它们应用到运维工作中。

NO.5

《Linux运维之道(第2版)》

丁明一 编著

运维案头书,红帽推荐,大量经典案例、问题分析,内容全面升级至CentOS7.2。

本书将围绕Linux操作系统这样一个基础平台,讲解如何使用操作系统实现各种开源产品的应用案例。全书主要从运维工作中的应用服务入手,全面讲解基本Linux操作系统以及各种软件服务的运维工作。

本文分享自微信公众号 - 博文视点Broadview(bvbooks),作者:博文视点

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 深度学习在推荐领域的应用:Lookalike 算法

    当2012 年Facebook 在广告领域开始应用定制化受众(Facebook CustomAudiences)功能后,受众发现这个概念真正得到大规模应用。什么...

    博文视点Broadview
  • SRE生存指南:系统中断响应与正常运行时间最大化

    近20年是互联网技术飞速发展的20年。互联网业务的快速发展不仅直接带来了流量、安全等方面的不确定性,同时也促进了技术架构的快速演进——技术架构变得越来越复杂,而...

    博文视点Broadview
  • 数据工作本质:从业务中来,到业务中去

    经过取数工作后,就形成了由业务运行产生的原始数据。原始数据是极其丰富的,有很多种分类方法,而从用户的观点来看可以大致分为两种。一种是用户意识到的主动提供的,如注...

    博文视点Broadview
  • 运维人不可不知的三张武功心法图

    下图不清晰,可点击放大,或者下载保存到电脑上扩大观看!也可到文末查看原文地址保存高清图片~

    IT大咖说
  • DOIS大会参会总结和思考

    上周去参加DOIS(DevOps International Summit,缩写:DOIS)会议。除了自己的分享外,也看了一些其他公司当前在做的事情,谈谈个人的...

    赵成
  • 先标准化还是先自动化:IT运维管理升级,该如何做是好?

    IT运维升级建设到底应该先进行标准化建设,还是应该先进行自动化建设,这个争议由来已久。

    嘉为科技
  • 数据处理的新方式:云计算

    【摘要】  云计算,是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。  云计算是继1980年代大型计算机到客户...

    CDA数据分析师
  • 分布式主动感知在智能运维中的实践|分享实录

    早期的运维工作比较简单,一般是先由系统集成工程师及研发工程师研发完项目后交付出来,再由负责运维工作的人员从后台做一些操作,保证系统正常运行。

    宜信技术学院
  • crontab不能执行sudo:抱歉,您必须拥有一个终端来执行 sudo

    最近做一个可执行shell调度的需求,要求用户输入shell,然后后台定时调度运行。实现大致为:保存用户的输入,设定时间,crontab定时执行用户的输入。但这...

    Ryan-Miao
  • 多云世界中的三个严酷的现实

    调查机构Gartner公司的调查表明,云计算和工业化服务的增长以及传统数据中心外包的减少,表明了企业向混合基础设施服务的巨大转变。到2021年其市场规模估计将达...

    静一

扫码关注云+社区

领取腾讯云代金券