前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >漫谈容器监控

漫谈容器监控

作者头像
SRE运维实践
发布2019-07-08 12:22:20
6400
发布2019-07-08 12:22:20
举报
文章被收录于专栏:SRE运维实践SRE运维实践

序言

很多事情说起来容易,做起来却很难,开始的时候就已经经历了各种选择,而开始才是一个真正开始。

监控系统需要监控很多资源,主要需要监控什么,为什么需要监控?

监控

打开脑洞,那是个无底洞,那是记忆的深渊,是否能改变或者是否是在准备?

docker的监控系统,有好几种监控方案,重在合适,prometheus作为一种集各种功能于一身的获取数据,存储数据,展示数据,告警功能于一身,这种一套完备的监控方案。

而对于weave scope来说,也是一种分布式的监控容器,最大的亮点在于在界面上能直接进入shell执行界面,就像登录了主机一样执行各种命令。

在docker中,其实本身就自带了监控的命令,只不过一般不会用来跨主机执行,从而这种是主要用来登录host主机,直接执行docker命令来查看所有容器的容器的方法。

在以上的命令中ls主要用来查看运行状态的容器,而对于其他状态的容器,可以使用参数,和linux命令是一样;而top主要是用来查看进程的信息,其实这个和linux命令的top略微有所区别,和命令ps的命令一样的,但是ps被ls以前的功能所占用;而stats主要是用来查看容器的性能数据,包括使用的内存,cpu,网络IO,块IO,进程号,那么如何来设置这些数据呢?

设置相关资源限定,也就是几个参数来限制,如上,主要设置了内存使用的大小为200M,使用swap空间大小为200M,CPU使用的权重为512,默认为1024,也可以设置cpu使用的颗数,然后设置了磁盘的读的速度。

为什么需要设置资源限定?

为什么需要设置资源限定?我有一台物理主机,CPU56颗,内存256G,带宽万M网卡,能跑多少个容器?

资源限定?在一个集群中,有多少台物理机器组成,能给客户使用多少内存,多少CPU,多少存储,多少网络。

在VM的时代,创建VM的时候,也要进行规划,一台主机上最多可以创建几个VM,分配多少的计算,存储和网络资源。

再是工作的时候,公司给你开多少一个月?有多少预算,资金链上有多少钱?

对整个集群中资源进行划分了后,那么就要涉及到调度,在哪个host上创建这个容器,在哪个vm上创建这个容器,这就是所谓的规划。。

容器如何做资源限定

容器来进行资源的限定和资源隔离呢?

在linux上怎么来进行资源的隔离?chroot,使用不同的文件系统来隔离用户,隔离用户的权限,容器也不例外,使用的是namespace来进行隔离,各种各样的命令空间,在各种编程语言中也是可以看到。

在容器的资源隔离的时候,主要使用了6种:

UTS:主要用来设定容器的主机名称和域名,主要的作用是让容器在网络上成为一个单独的节点,而不是宿主机上的一个进程。unix time-sharing system。。分时系统。。ntp?还是cpu的时间片呢?

IPC:进程间通信,有独立的通信空间,在一个namespace中的进程可以相互通信。inter process communication。

PID:进程隔离,和宿主机上进程进行隔离。

network:网络隔离,有独立的网络栈,有独立的端口,网络设备,这也就是为什么每次创建一个容器网络的时候,会有一些桥接设备,host模型的网络使用。

user:用户隔离,主机上的用户和容器中的用户会有一层映射关系,但是不会相互影响。

mount:挂载的文件系统,主要使用文件系统的隔离,可以理解为chroot的一种实现方式。。。再想想容器的文件系统组成,unfs,联合文件系统,容器的读写层,改变了容器的内容,不会影响使用相同镜像的容器。

而资源的限制则是使用cgroup来进行控制的。在相关的目录中可以找到,如下:

而这种数据还能在docker inspect nginx中找到,如下:

从而在监控的时候可以使用不同的方式来进行监控。

总结

1、 在监控容器的时候,几个关键指标,容器运行的数量,容器分配的计算(cpu和内存),网络,存储资源。

2、 监控的方式多样,可以使用基本的docker命令来进行监控,也可以直接查看相应目录下的文件获取对应的信息。

3、 容器的资源分配,主要涉及到容器的资源分配和规划,就算是在集群中,底层无需考虑,但是每个容器占用的最大资源需要进行限制,不然可能耗费掉整个集群的计算能力、网络能力或者存储能力。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-03-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SRE运维实践 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档