运维开发故事

运维开发相关笔记
126 篇文章
64K 次阅读
39 人订阅

全部文章

没有故事的陈师傅

置顶Zabbix 4.0升级5.0 &&ES 6.1升级7.0

升级期间,不会影响到现有的系统,系统将保持正常的运行,升级完成后,将进行一段时间的可用性测试,待系统稳定后将替换生产上的监控。

91530
没有故事的陈师傅

Traefik mesh:更简单的服务网格

Traefik mesh是一款轻量级的服务网格,它简单易行,易于安装并且易于使用。

9740
没有故事的陈师傅

k8s故障检测与自愈(一)

DNS故障:6个DNS Pod中的2个出现无法解析外部DNS名称的情况。后果是大量线上业务因域名解析。

9020
没有故事的陈师傅

今天,我要干掉 if ... else ...

近日在公司领到一个小需求,需要对之前已有的试用用户申请规则进行拓展。我们的场景大概如下所示:

10130
没有故事的陈师傅

Kubernetes组件问题排查的一些方法

Kubernetes的基础组件就像一栋房子的地基,它们的重要性不言而喻。作为Kubernetes集群的维护者,经常会遇到组件的问题,那平时是怎么去定位解决的呢?

7830
没有故事的陈师傅

分布式锁看了又看,最佳方案我来告诉你

对于商品秒杀的场景,我们需要防止库存超卖或者重复扣款等并发问题,我们通常需要使用分布式锁,来解决共享资源竞争导致数据不一致的问题。

9220
没有故事的陈师傅

面试官上来就问 ZAB 协议,瑟瑟发抖…

ZAB 全称为 Zookeeper Atomic Broadcast(Zookeeper 原子广播协议)

6620
没有故事的陈师傅

面试官问我zookeeper选举过程,我当场给他讲了源码

zookeper 在生产环境中通常都是通过集群方式来部署的,以保证高可用, 下面是 zookeeper 官网给出的一个集群部署结构图:

8240
没有故事的陈师傅

专栏|使用zabbix-agent2自定义插件获取https证书过期时间

Zabbix运维工程师,熟悉Zabbix开源监控系统的架构。乐于分享Zabbix运维经验,个人公众号“运维开发故事”。

5530
没有故事的陈师傅

Gin集成Casbin进行访问权限控制

Casbin是一个强大的、高效的开源访问控制框架,其权限管理机制支持多种访问控制模型,Casbin只负责访问控制[1]。

10530
没有故事的陈师傅

通过Prometheus来做SLI/SLO监控展示

SLI,全名Service Level Indicator,是服务等级指标的简称,它是衡定系统稳定性的指标。

11020
没有故事的陈师傅

使用KubeNurse进行集群网络监控

在Kubernetes中,网络是通过第三方网络插件来提供,这些三方插件本身的实现就比较复杂,以至于在排查网络问题时常常碰壁。那么有没有什么方式来监控集群中所有的...

7330
没有故事的陈师傅

kubeadm部署K8S集群并使用containerd做容器运行时

去年12月份,当Kubernetes社区宣布1.20版本之后会逐步弃用dockershim,当时也有很多自媒体在宣传Kubernetes弃用Docker。其实,...

12220
没有故事的陈师傅

prometheus告警问题分析

最近运维prometheus的过程中发现,有的时候它应该发送告警,可实际却没有;有的时候,不该发送告警却发送了;还有的时候,告警出现明显的延迟。为了找出其中的具...

8630
没有故事的陈师傅

GitLab Runner介绍及安装

GitLab Runner是一个开源项目,用于运行您的作业并将结果发送回GitLab。它与GitLab CI一起使用,GitLab CI是GitLab随附的开源...

11520
没有故事的陈师傅

K8S与Vault集成,进行Secret管理

Vault 是用于处理和加密整个基础架构秘钥的中心管理服务。Vault 通过 secret 引擎管理所有的秘钥,Vault 有一套 secret 引擎可以使用。

13340
没有故事的陈师傅

使用ansible部署ceph集群

查看安装状态,发现有一个警告,这是因为在之前的all.yml配置没有开启允许自动调整pool中的pg数pg_autoscale_mode: False,手动设置...

14031
没有故事的陈师傅

手动部署ceph octopus集群

所有 Ceph 群集至少需要一个monitor,并且至少需要与存储在群集上的对象副本一样多的 OSD。引导初始mon是部署 Ceph 存储群集的第一步,这里我直...

24830
没有故事的陈师傅

使用ssl_exporter监控K8S集群证书

使用kubeadm搭建的集群默认证书有效期是1年,续费证书其实是一件很快的事情。但是就怕出事了才发现,毕竟作为专业搬砖工程师,每天都很忙的。

9930
没有故事的陈师傅

使用blackbox_exporter进行黑盒监控

黑盒监控:主要关注的现象,一般都是正在发生的东西,例如出现一个告警,业务接口不正常,那么这种监控就是站在用户的角度能看到的监控,重点在于能对正在发生的故障进行告...

20220

扫码关注云+社区

领取腾讯云代金券