00:01
各位大家好,下面我们继续来学习K8S。下面呢,咱要讲什么呢?我们来说一下KY中的集群资源监控,咱来讲这个资源监控的内容,那我来写一下。集群资源的监控,那在这里边呢,给各位主要讲解这么几个内容,首先第一个内容给各位说一下,我们现在要对这个KS进群做个监控,咱们的监控指标有哪些,就是咱要监控什么东西,包括达到什么样要求,然后第二个呢,我们就实际搭建这么一个监控的。这么一个平台。咱们来做这么一个。搭建,但实际中呢,我们搭建这种监控平台有不同的方案,我这里边给各位选举其中的一种方案,然后咱们进行这么一个搭建,所以这个是我们要讲的KYS中集群的资源监控,那咱们来看一下,首先第一个我们先看一下这个监控指标,就是咱要监控的话,我们要监控有哪些内容,包括里边主要是监控什么东西。
01:13
那我给各位写一下啊,就是咱们一般来讲啊,要对这个K8S集群进行监控,其实咱监控呢,主要应该是有这么两大部分这个内容。那哪两部分写一下啊,第一个要监控,就是咱们的集群本身的一些监控,那里面监控什么呢?说一下,比如说你现在这里边的节点资源的。利用率,比如我现在有NODE1NODE2节点,然后每个节点目前CPU占比多少,它用了多少CPU,然后剩余多少,就是它一个完全的利用率。然后第二个咱就包括就是我们当前这个节点数,比如我当前有三个节点,有两节点处于这个这个忙碌的状态,一个节点处于空闲状态,那在在分配中要做考虑,就做一个节点数的监控,然后除了它之外还要监控下我当前里边运行到pod,比如现在我有一个节点,每个节点中运行了多少个pod,这些咱们在监控指标中,交警监控这是第一部分,就是集群他本人监控,包括节点利用率,节点数以及运行pod,主要是针对节点部分的一些相关监控。
02:28
啊,这是第一个指标,然后第二个呢,监控中经常要监控第二部分是各位可以想一下咱还要监控什么。我们节点里边最终运行的是不是有我们的pod包里面的容器,所以大家要对这个pod做一些相关的监控,然后这里边要监控什么呢?说一下啊,首先然后监控就是里边这个,比如说我们容器的一些指标,比如我现在这里边pod里边运行了多少个容器,然后容器中是不是有咱们具体那个应用的程序,咱对它做监控就是里边一个利用率。
03:04
咱通过监控能看到我当前集群的一个完整的运行情况,比如说我这里边有多少个节点,每个节点占用了多少CPU,哪个节点目前繁忙,哪个节点目前空闲,然后里边的pod,包括容器,包括用程序,它目前的状态是正常运行,还是说目前已经出现的问题等等,所以这是我们在监控中需要考虑到的一些相应的监控指标,咱们需要对它进行监控。也就是说一般来讲,一个比较完整的监控系统,基本上都会包含这些相内容,对咱们集群的一个总体情况做一些相应的监控,所以这个啊是咱们做的一个说明。然后这个说完之后,咱们下面就来具体搭建这么一个监控平台,再来做一个监控平台的。这么一个搭界。
04:01
而监控平台搭建的这种方案可以说有很多很多,我们现在呢,给各位选举其中的一种方案,什么方案呢?咱用用这么两个组件搭建,第一个组件,就咱们看一下这个组件。它翻译过来叫普罗米修斯这么一个组件。我把这个给各位拿回来,就是咱第一个用这个东西。叫普罗米修斯,然后加上一个叫格法的这么一个东西。Fanna啊,Gra发用这个组件来搭建我们一个监控平台,然后这两组件分别是什么?给各位先做个介绍,然后咱们做个搭建,因为这种方案普罗米修斯加上gra法在实际应用中应该很广泛,因为它的扩展性很好,而且搭建也比较容易,所以实际中我们经常用这种方案来搭建一个监控的平台。
05:01
好,那下面呢,我把这两个组件呢,给各位详细介绍一下,第一个就这个叫普罗米修斯。然后这个组件它主要是干什么的呢?给各位来做个介绍,我在这里边写一下,关于这个叫普罗米修斯。然后在这边说明这普罗米修斯呢,其实它是一套开源的,它是可以说在里边呢,可以做很多功能,比如说我们可以监控,可以报警,包括可以做一个时间序列,它里边本身也可以做一个数据库进行使用,所以它的功能可以说很强大,也说的通俗点,用这个组件我们可以就是定时去搜索,或者去抓取一下你被监控组建一些状态的数据,比如当天哪些组件,包括里边利用率,然后它里面是通过HTP协议进行这种系统的监控,另外它会把数据进行存储,因为它也可以做一个数据库进行使用,所以这个功能可以说在是一中很强大,包括在这个操作中能它不需要应用任何的SDK,也不需要任何其他的集成方式。
06:11
直接通过HTP接口方式就可以接入我们这监控系统,然后接合我当前节点,比如说当前有一个mastert节点,有两个note节点,那我们用HTB接口方式接入这个系统,对我当前这些节点就可以进行监控,它不需要接下来开发,所以这种方式呢,特别适合我们这种虚拟化环境,比如说我们的刀口,比如说我们的虚拟机,所以我们KS中这种普罗米修斯应用应该是极其广泛的,这是它的一个介绍。我在里边给各位来写一下。就是这个普罗米修斯,它是一套开源的。这么一个东西,然后在里边呢,可以做到很多功能,比如可以做到这个。监控,包括你这个报警,另外它也可以做一个数据库啊,就是它里边集成了很多功能,然后这个操作中,刚才大家提到一个特点,它是以一种方式,就这个叫HTTP的这种协议,这种方式它是可以你这么理解,就是周期性的。
07:16
比如说每隔十分钟,每隔15分钟他去。抓取注意是啊,抓取你那个被监控。组建的那个状态,包括里边一些相应的数据,他要完成这么些操作。所以这个啊,就是它的一个特点,然后这里边好处什么呢?因为它是以HTP协议方式进行操作,所以它不需要就是很复杂的啊,不需要复杂的这个集成的。这么一个过程,我们只需要使用HTP接口接入就可以了,所以它的可以说部署会特别的方便,直接用方式直接部署就可以使用,所以这种方式呢,特别适合我们这种容器化,比如说我们的刀口虚拟化环境中,这个虚拟机环境用它特别合适,所以这个叫普里修斯,所以咱一会用它做操作包,用它监控我们当前这个节点,然后在里边做这种监控报警,另外把它存到它自带那个数据库中,这个叫普罗米修斯,是里边的。
08:28
第一个监控的组件。然后除了这个之外呢,在里边我们用到还有第二个组件,这个组件叫。那我写一下啊这个组件。Gra final gra fanna,然后这个组件是什么呢?给大家强调啊,其实你可以理解为这个组件作用主要做你的展现功能,比如说现在我们通过这个普罗米修斯抓取到很多状态的数据,然后这个数据是不是要通过一个页面展现出来啊,所以说这个发的是什么?
09:01
它也是一个开源的,用于什么?因为做你的一个数据分析和一个叫可视化的一个工具,比如现在我产生了很多的数据,数据肯定是不规则的,而通过管发呢,他开发数据给我做一些分析,然后用一些我们能够很明显看出效果的一些方式展现出来,比如说用图表,有些什么表格形式给我们做个展现,所以这个啊,就是叫gra发,把数据进行分析,然后对我们这里边进行一个展现。这个是一个展现工具,而这个展现工具它一个好处就是它支持多种数据源,就是咱刚才提到普罗米修斯是不是它本身也是一种具备存储功能的数据库嘛,所以它里面就支持这个普米修斯包,还支持比如说买circle,什么inle DB等等不同数据源,所以咱一会儿用数据修斯所咱数据源,然后通过gra读取里边内容,然后把数据进行分析,用这个可视化工具,最终做个展现。
10:06
所以这个啊,是我们搭建这个监控平台中用到的两个组件,普罗米修斯,还有这个转发的各位对它有一个最基本的一个认识,把这个给各位做个说明,然后这个说完之后,我把这两组件,它这个就是最基本一个架构的这么一个过程,给各位用个图再来画一下,就画一下它的过程啊。我来画一下啊,比如说我现在。这里边有两个节点啊,就是一个node,一一个no,咱们有两个节点,假如这是我们的。E1下面这是我们的no袋,然后在里边呢,它是要部署有很多这个容器啊,就是里边会有很多的这个容器,比如说啊,假如画一下里边有肯定是有多个容器啊,当然可能有一个两个三个,我以两为例,就里边有容器。
11:02
就咱说那个container。容器,然后我现在比如说我在这个集群环境运行过程中,肯定会产生各种数据,包括我现在运行在这个节点中,我当前节点的这个机器的CPU,包括节点的数量,包括我pod容器等等这些相关指标里边肯定都会有各种数据,而这些数据这里边可能就会产生,那产生过程中我们要怎么做呢?给各位画一下啊,就是现在我们就通过我们这个工具叫这个普罗米修斯,就是这个东西通过它。然后通过他要干什么呢?他就会周期性的从我这个被监控节点中去抓取你这个状态数据,比如他每隔15分钟或者每隔半小时到里边去抓取你的数据,他会做这个事情。就是。抓取。数据,然后抓取数据之后,把数据在这个普鲁修斯里边要进行存储,你为了我们最终能做分析,做展现,因为它里边也做到了监控数据库这种功能,它这过程中通过HTP协议方式周期性加这种抓取,然后在那里边用HTP接口直接接入就可以了,所以里边有这个过程,然后这个做到之后,咱后面肯定要把这数据最终给它做个展现,因为里边会产生很多数据。
12:31
那怎么展现用到咱们刚才说的另外一个组件这个。Fanna,然后这个组件干什么呢?它就会你可这么理解,读取你这个普米修斯这个数据源中我们抓取到的数据,把数据进行分析,然后分析之后把这数据通过可视化工具做一个展现,所以这是里边一个最基本一个架构,弗尔米修斯抓取数据进行存储,Grand final读取数据进行展现,所以这个啊是关于咱们监控平台的这么一个基本的方案。
13:05
所以各位把它知道,比如说现在咱就讲了一下,我们监控一个K8S集群中的监控指标,就是监控哪些,包括咱们这种大取的这种方案,咱通过普罗米修斯和gra发,然后两组先是干什么的,包括他的过程给各位都做了一个说明,所以现在把这个我们就做了一个讲解,然后讲解之后咱们下面开始就实际搭建一下这么一个监控平台。啊,所以各位把这个理论知识先给他知道。
我来说两句