首页
学习
活动
专区
工具
TVP
发布

SRE运维进阶之路

记录SRE运维、云原生
专栏作者
19
文章
3246
阅读量
13
订阅数
Etcd 概述
Etcd 是 CoreOS 团队于2013年6月发起的开源项目,它的目标是构建一个高可用的分布式键值(key-value)数据库。etcd内部采用raft协议作为一致性算法,Etcd基于 Go 语言实现。
SRE运维进阶之路
2024-04-23
870
评估 Etcd 性能及可靠性
SLI(Service Level Indicator):服务等级指标,其实就是我们选择哪些指标来衡量我们的稳定性。
SRE运维进阶之路
2024-04-23
830
弹性伸缩落地实践
HPA(Horizontal Pod Autoscaler)是 Kubernetes 中的一种资源自动伸缩机制,用于根据某些指标动态调整 Pod 的副本数量。
SRE运维进阶之路
2024-04-23
820
云原生实践总结
CLOUD NATIVE LANDSCAPE https://cncf.landscape2.io/?group=projects-and-products
SRE运维进阶之路
2024-04-23
1030
K8s 一条默认参数引起的性能问题
系统资源的瓶颈,可以通过 USE 法,即 使用率、饱和度以及错误数这三类指标来衡量。系统的资源,可以分为硬件资源和软件资源两类。
SRE运维进阶之路
2024-04-23
810
SRE 学习路线
SRE(Site Reliability Engineering)站点可靠性工程是一种结合软件工程和运维运营原则的角色和方法论,旨在在系统、服务或产品的设计、开发、部署和运维过程中,采取一系列措施来确保其持续稳定运行、可靠性和可用性。
SRE运维进阶之路
2024-04-23
1180
什么?相同型号物理机 容器性能不如虚拟机?
[xx:xx] 扩容,扩容发布均有失败,但是虚拟机成功率高,容器 fullGC 时间长,请求堆积,异常
SRE运维进阶之路
2024-04-23
660
Linux 性能基准测试工具及测试方法
上篇文章 「什么?相同型号物理机 容器性能不如虚拟机?」 ,给我们的经验教训,就是上线前,基准测试的重要性,这篇文章着重介绍一下「Linux 性能基准测试工具及测试方法」
SRE运维进阶之路
2024-04-23
1190
Kubernetes Controller 机制详解
Kubernetes API List/Watch 机制 与 Informer 客户端库
SRE运维进阶之路
2024-04-23
1030
我们的虚拟化变革之旅
我们最初采用oVirt作为我们的虚拟化平台,事实证明它是一个很好的产品,具有几个显着的优势。其开源性质使我们能够利用广泛的功能和定制选项。
SRE运维进阶之路
2024-04-23
830
kube on kube 实现思路分享
这里的 kube on kube , 是指建立 K8s 元集群,纳管其他业务 K8s 集群,通过声明式 API 管理集群的创建、增删节点等。
SRE运维进阶之路
2024-04-23
710
巧用 shell-operator 配置 K8s Pod 保护策略
本篇主要介绍第四点:巧用 Shell-operator 配置 K8s Pod 保护策略
SRE运维进阶之路
2024-04-23
630
云原生落地实践
d. 风险控制:测试没问题,再上线,环境依次是,work --> test --> ut --> prod 灰度 --> prod 全量;做好回滚虚拟机的应急方案
SRE运维进阶之路
2023-12-04
1850
容器化后无损上下线解决方案
绝大数事故发生在应用上下线发布阶段,所以要尽可能避免发布过程中由于应用自身代码问题对用户造成的影响。
SRE运维进阶之路
2023-11-21
2820
弹性伸缩落地实践
HPA(Horizontal Pod Autoscaler)是 Kubernetes 中的一种资源自动伸缩机制,用于根据某些指标动态调整 Pod 的副本数量。
SRE运维进阶之路
2023-11-21
1920
Etcd 故障排查
SRE运维进阶之路
2023-06-23
2770
Etcd 监控
Grafana 大盘: https://github.com/clay-wangzhi/grafana-dashboard/blob/master/etcd/etcd-dash.json 导入即可
SRE运维进阶之路
2023-06-21
3500
评估 Etcd 性能及可靠性
SLI(Service Level Indicator):服务等级指标,其实就是我们选择哪些指标来衡量我们的稳定性。
SRE运维进阶之路
2023-06-20
6030
Etcd 高可用故障演练
本次演练旨在测试 Kubernetes 的 etcd 高可用性,检验是否能够在其中一个 etcd 节点发生故障的情况下,其他 etcd 节点能够接管其工作,确保集群仍能正常运行。
SRE运维进阶之路
2023-06-19
2980
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档