首页
学习
活动
专区
工具
TVP
发布

SRE运维实践

专栏作者
83
文章
125497
阅读量
24
订阅数
从一个小问题探讨解题思路
前奏一响,心一动,就是跑路的信号,从入门到删库。。。你看这篇文章,她像不像一封辞职信。
SRE运维实践
2022-04-12
1.2K0
hadoop之yarn调度
在大数据的生态中,hdfs解决了海量数据的存储问题,mapreduce解决了海量数据的计算问题,而在任务的执行和资源统一管理层面,则是使用yarn进行统一调度。
SRE运维实践
2021-03-04
6100
k8s错误CrashLoopBackOff
查看一下相关的日志看看(kubectl describe pods test-pod):
SRE运维实践
2020-03-06
12K0
一桩VIM引发的血案
在使用vim的时候,如果打开的小文件,没啥问题,如果打开的超大类型的文件,那么就会引发巨大的风险,轻则内存使用爆炸,重则引发操作系统oom。
SRE运维实践
2019-11-28
2.4K0
容器不同用户显示时间不不一致
在容器里面进行监控的时候,大量的依赖于时间,如果容器运行在物理机上,那么肯定有ntp同步,如果容器运行在虚拟机上,也是需要时间同步的。
SRE运维实践
2019-07-08
1.9K0
漫谈容器监控系统
当容器运行在物理机上的时候,一般的监控的agent是直接运行在物理机上,在进行容器的健康检查的时候,依赖于docker客户端程序。
SRE运维实践
2019-07-08
9290
容器的网络选择实践
容器的原生网络提供了三种,一种是host模式,一种bridge模式,一种则是none模式,至于第三种模式未使用过,在此掠过不谈,没有具体的使用场景。
SRE运维实践
2019-07-08
5240
删除容器能不能减少磁盘空间使用
在维护一个容器组成的基础设施部分,运行的时间长了,总是会碰到各种各样的磁盘问题,不是日志不规范,就是各种路径不对。
SRE运维实践
2019-07-08
1.3K0
容器镜像中心
容器总是存在一个镜像中心,而一个镜像中心的存在主要是为了保存所有的镜像image,而在使用的时候,总是要追求高可用,从而会有不同的架构。
SRE运维实践
2019-07-08
1.3K0
闲聊僵尸进程
记得好像写过相关僵尸进程的东西,稍微再写一点,因为总是有人说僵尸进程的存在会导致机器的load值变高,不知道哪里看到的谬论。
SRE运维实践
2019-07-08
1.8K0
容器的文件系统
很多时候都会焦虑,为什么会焦虑呢,因为变化的太快了?急于看到结果?基于事实去看的话,焦虑可能要少点儿,焦虑的时候多注意观察,慢慢积累沉淀。
SRE运维实践
2019-07-08
7200
闲聊容器的标签
容器的每个部分都可以打标签,也就是我们经常谈到的label,例如容器container有标签,镜像image有标签,网络network有标签,存储卷volume有标签,最可恶的居然是dockerd也有标签。
SRE运维实践
2019-07-08
7300
闲聊虚拟机迁移
一辈子很长,你会看到各种各样的风景,你装饰了别人的风景,别人点缀了你的梦,歌很慵懒,在这明媚的天气恰好合适。
SRE运维实践
2019-07-08
1.4K0
容器。。。杀还是不杀
容器总是有启动脚本,有的时候脚本有bug,从而造成容器的死循环。。。杀还是不杀。。。
SRE运维实践
2019-07-08
8120
容器变更,这是个坑
容器的运行都是通过一个镜像就能运行了,而镜像在使用的时候都是从registry中pull过来的,然后保存在本地之中,然后再利用这个image进行运行容器。
SRE运维实践
2019-07-08
6120
容器的overlay文件系统
由小看大,由虚拟看抽象,其实你也不知道这是一个vm还是一个容器,还是一个物理机。
SRE运维实践
2019-07-08
4.6K0
容器OOM问题排查思路
外界的刁难,挑战。。。其实并不是最难的,最难的总是内部难以安抚,OOM。。。内存泄漏,OOM killer了解一下。。。攘外必先安内。。。我可能要死在内部了。。。
SRE运维实践
2019-07-08
4.3K1
磁盘使用了偏高问题排查思路
双十一即将来临,做电商的大佬们都准备好了各种应急预案了么。。。例如服务降级,流量控制,扩容方案。。。又快到了一年一度的剁手大会了,不过这个时候,应该是运维最繁忙的时候了吧。。。使用率百分百?用流量打爆。。。Emmm,这很酷
SRE运维实践
2019-07-08
3.4K0
运行容器的虚拟机SSH远程无法连接
最近碰到一个诡异的问题,ssh登陆的时候,显示无法Permission denied,是不是很熟悉。。。
SRE运维实践
2019-07-08
2.1K0
容器无限重启
在使用容器的时候,有众多的选项供我们选择,也就是dockerd --help的各种选项,当修改了dockerd的配置的时候,需要重新加载配置文件或者重启。。。或者对容器进行升级,那么这个时候就有一个选项live-restore为true,从而可以试试这个选项。
SRE运维实践
2019-07-08
1.7K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档