运维一切

111 篇文章
24 人订阅

全部文章

domain0

腾讯 · 工程师 (已认证)

nfs v4.0协议下的服务器load升高问题

在使用nfs v4.0协议挂载nfs文件系统的时候,存在一个seq id序列号瓶颈问题,具体内容请看https://access.redhat.com/solu...

11520
domain0

腾讯 · 工程师 (已认证)

k8s如何指定使用ceph-fuse

本来想使用ceph-fuse,结果一直在报mount can't read super block的错误,但是我只给主机安装了ceph-fuse的rpm包,k...

11010
domain0

腾讯 · 工程师 (已认证)

在线调节文件系统大小中遇到的问题

The Solution A file system inconsistency blocked the online resize of the disk, ...

13120
domain0

腾讯 · 工程师 (已认证)

ceph 10.3版的安装

11330
domain0

腾讯 · 工程师 (已认证)

rsyncd配置

9120
domain0

腾讯 · 工程师 (已认证)

查看,修改ceph节点的ceph配置命令

该命令要求必须在 osd.1 , mon.node1节点上才能执行 这三种方法显示结果都是一样的,不过第三种方法的显示格式和一二种不同而已。

33820
domain0

腾讯 · 工程师 (已认证)

Ceph对可用存储空间的校验与控制

mon_osd_full_ratio:集群中的任一OSD空间使用率大于等于此数值时,集群将被标记为Full,此时集群将停止接受来自客户端的写入请求;

13340
domain0

腾讯 · 工程师 (已认证)

“resize2fs: Permission denied to resize filesystem”

On CentOS/RHEL 6, an LVM volume group size has been extended and an attempt to d...

99210
domain0

腾讯 · 工程师 (已认证)

kubelet启动之后的证书问题

kublet启动之后使用bootstrap.config来生成kubelet.conf,但是如果apiserver的证书配置有问题,就会导致无法注册node成功...

49220
domain0

腾讯 · 工程师 (已认证)

ceph rbd在k8s中挂载卡住导致应用无法启动的问题

服务挂上rbd正常读写,经过很长时间之后再次发布就会出现timeout的错误,导致服务无法启动,但是如果强制把服务缩容到0,然后再发布改成1,这样就能启动成功,...

33020
domain0

腾讯 · 工程师 (已认证)

calico网络原理、组网方式和使用

calico是一个比较有趣的虚拟网络解决方案,完全利用路由规则实现动态组网,通过BGP协议通告路由。

3.5K40
domain0

腾讯 · 工程师 (已认证)

ceph-osd pagecache使用限制问题

ceph-osd上发现内存使用很严重,特别是cache的使用,巨大的内存使用如果不及时释放,加上swap很小,在遇到大文件读写时就会引发kernel oom,进...

36120
domain0

腾讯 · 工程师 (已认证)

ceph写流程分析

经过pool,rbd,object、pg的层层映射关系,在PG这一层中,已经知道存储数据的3个OSD所在位置及主从关系。 客户端与primay OSD建立SO...

38120
domain0

腾讯 · 工程师 (已认证)

ceph-osd pagecache使用限制问题

ceph-osd上发现内存使用很严重,特别是cache的使用,巨大的内存使用如果不及时释放,加上swap很小,在遇到大文件读写时就会引发kernel oom,进...

26610
domain0

腾讯 · 工程师 (已认证)

linux buffer cache的回收

在Linux系统中,我们经常用free命令来查看系统内存的使用状态。在一个RHEL6的系统上,free命令的显示内容大概是这样一个状态:

71640
domain0

腾讯 · 工程师 (已认证)

挂载信号知识

简单点说,Shared subtrees就是一种控制子挂载点能否在其他地方被看到的技术,它只会在bind mount和mount namespace中用到,属于...

9630
domain0

腾讯 · 工程师 (已认证)

kubelet的tls证书理解记录

kulelet如果有token的方式做认证,只需要生成一次bootstrap-kubeconfig就可以了 生成的方式

33920
domain0

腾讯 · 工程师 (已认证)

k8s apiserver的代理健康检测问题

apiserver前面如果有lvs做高可用,lvs对apiserver做健康检测要注意不能使用tcp check,否则会触发报错

51710
domain0

腾讯 · 工程师 (已认证)

ceph-fuse报错“get_fuse_groups: getgroups failed: (5) Input/output error”

这算是一个bug吧,详情看这里 https://tracker.ceph.com/issues/23446

15230
domain0

腾讯 · 工程师 (已认证)

kubernetes 下实现socket.io 的集群模式

socket.io 单节点模式是很容易部署的,但是往往在生产环境一个节点不能满足业务需求,况且还要保证节点挂掉的情况仍能正常提供服务,所以多节点模式就成为了生成...

41830

扫码关注云+社区

领取腾讯云代金券