00:00
大家好。这一节视频我们再来讲一下。的另外一个插件。嗯,叫Co。顾名思义,他是用。嗯,就是跟K8S相关的,我们来看一下。它是用来干嘛的呢?他是通过嗯,普罗米修斯来展示K8S的一个。资源的。一个插件。然后呢,我们看到了这个本身我也没打算讲这个。插件,因为它已经两年没有更新了啊。嗯,但是有小伙伴在问,说在配置使用普罗米修斯啊,在配置这个插件的时候,然后遇到一些问题,就是数据设计不起来,没有没有办法展示。啊,确实因为这个插件啊,这么两年没更新了,然后呃,就是说一些数据指标啊,那个名称啊,可能也发生了变化,我看。
01:09
官方好像也没打算维护,然后我当时讲,除了讲这个插件之外,官方的这个插件之外,另外我还会讲。转到。这个插件。啊,就基于。嗯,就是Co graph,它这个插件呢,是基于。K8S。就刚才这个格拉兰官方的这个。这个插件。嗯,更新的,嗯。一个是一个社区插件,嗯,基于古的官方,就刚刚才那个插件。官方的插件更新了。嗯。然后我们来看一下它的效果是怎样子的。啊,这里有两个图标。这个就是。嗯,官方的一个插件,我们来看一下。
02:01
啊,它的是一个这样的,就是说点cluster这里我已经配置好了,待会我我会删除掉这两个插件,我都会删除掉重新配置啊。我们来看一下它的效果啊,OVER6,它这里是一个集群的dashboard,还有节点的dashboard,还有pod container的dashboard啊。然后我们来再看一下这个产。嗯,这个是社区的这个插件,它的是一个也是一个集群状态应用的。应用概览概述节点的概述啊,它是这样的。我们来看一下集群的状态。啊,这个集群的一一个状态,它是这样子的。它首先是一个pod的,整个pod的一个使用,使用情况,使用率。啊,集群破的使用率,然后CPU使用率,然后内存使用率和。Dis磁盘,嗯,磁盘这个应该是啊,就是说啊指标可能发生了变化,嗯。
03:07
他没有采集到,我们一会再看啊,就是这样一个一个一个视图,当然有一些指标,比如说没有可能是名字,就是说监控的像。嗯,Co state metrics,或者是或者是嗯,Container adviser,这这些工具的指标里面的名字发生了变化,也有可能是本身它的它就没有值,像比如说下面的叫我,我本身就没有叫我,所以它可能就是ma的啊,就没有啊,这个是集群的状态,然后我们来看一下Co gra这个设置插件它是怎样子的。然后它这里显示了集群的状态,是说你的集群是work fine。然后application value,它这里面就是说显示了。名称空间,各种名称空间就是说它的资源啊。
04:01
啊,所有资源,像name space,民生工间下面的一些像这种deployment,这种资源负载的state state,或者说demon set这些这些资源的。一个一个情况。然后这是节点的一个状态,比如说master节点啊,资源是怎么样的,然后。嗯,下面有哪些name space,下面有哪些破的?啊,然后的一个资源的使用情况,有没有就是说做request或者是limit这些限制啊,最小使用或最大使用,对内存CPU这些有没有做限制。啊,然后log个零一漏个零二啊,然后我们点其中一个节点,我们可以跳到对应的里面去啊,这上面的有一些也是因为指标名字不一样,所以他没有没有展示。啊,它啊这个社区插件呢,它的监控的力度就是很细的啊,分了很多项,你看到没有啊。
05:06
分了很多。是吧?啊,而且我为什么要提到这个插件呢?你我们来看一下这个插件还一直在更新,最近更新就是十几天前,说明这个还一直在维护的啊,就是说如果遇到一些明显的bug啊什么的,他可能还会还会接着修复。当然了,如果我们对。嗯,对普罗米修斯的计算公式,还有就是说里面的指标非常熟悉的话,我们是不需要。我们是不需要这些单的,我们完全自己啊,写计算公式来。来做这种单细胞的。这就是说啊,这个官方的这个有时候其实你经常会加载不出来啊。我们来看一下破的啊,这些它是一个这样的。
06:01
其实这个我觉得。确实没有这个社区的这个插件做的好。啊,他从落的破的deployment Di set state set,这些都有做。啊,这些。好,我们现在来来看一下这两个插件怎么。怎么安装的?嗯,首先呢。嗯,这两个插件的就是说。啊,配置。是类似的,首先要经过K8S的一个授权,就是说因为K8S的话,它是通过都是通过API啊去调的调用的,然后它是有一个HTTPS的一个认证啊,通过这种方式来做的。然后安装方式的话,像这种。这个插件不管是graph,嗯,APP啊,APP这个插件的安装,或者是Co gra APP的这个插件的安装都是。
07:10
之前也讲过安装方式是一样的,但是呢。我们在。安装这个插件的时候,首先我们要部署好。这个集群。然后我们因为我们监控的目标就是他就是克雷,然后我们还要配置普罗米修斯,嗯,然后呢,采集数据用model export。Co states,还有container adviser这些。啊,还有就说server。啊,这些我们都要都要事先装好。装好了以后,我们才能采集数据。好,我们来看一下。我们先我们先卸载这两个插件吧。
08:01
嗯,我们来看一下。因为嗯。Any store。我们把。这个插件。算了。然后。再把这个插件也行。嗯,在哪里。嗯。这个插件也卸载了。在吵架。不了。
09:01
好,我们没关系,我们我们直接进到这里面把它删了,我们来看一下叫什么名字。哦,他他这个名字,名字不对,他就叫这个。好。那你展示的名字不对,好?我们来看一下是不是没有了啊。没有了,好,我们重启一下。我们再刷新一下,是不是这两个插件已经没有了。嗯,我们看一下这里面,这里面是没有了是不是。没有这个插件了。好,然后呢,嗯,集群我这里已经,集群我这里已经有了,就是K8S的这个集群已经有了,嗯,啊这一个。
10:07
啊,这个集群我们来看一下。嗯。诶,加个标签,因为那里显示的是浪。我们先看一下master这个怎么写吧。一。我们。我们把这个标签复制一下。不。这个是弱的。
11:00
啊,这个只是我个人要把它配起来啊,这里没有影响,只是打个标签,嗯,这里显示是落的,表示它是落的节点啊,我这里是集群是V一点。一八啊,现在最新的应该V1.19了。是1.19吧,然后。就说我K8S的集群已经有了,我们看一下有哪些破。啊,有这些pod啊,然后这个是名称,名称中间namespace,这是pod的名字,然后。这个是状态,嗯,它的准备的就是说需要多少个已经运行。正常有多少个,就然后状态,然后重启次数啊,然后。就是说我们在使用这个,嗯,要使用这里,嗯。
12:00
Co gra或者说graph,嗯,Co APP这个工具的话,我们要知道我们要监控什么啊,因为监控KS的话,它毕竟就是说监控它的集群,然后它的资源的使用,像deployment pod,嗯,Container容器啊,这些东西对资源的一个使用率,还有这些集群的健康状态啊这些。嗯,然后。我们现在。来看一下啊,像load load export。还有Co metrics,嗯,Statex,还有sales weather这些工具。来干嘛嘞,Not export,它是监控。它是监控这个,嗯,就节点的。节点的这个资源就是说。嗯,然后就比如说内存,CPU磁盘这些节点的。然后另外就是。
13:03
嗯。Co state magics就是收集这些,嗯,集群的里面,嗯,K8S里面的一些指标啊,集群的指标通过它来收集的,然后还其实还是还依赖一个工具,叫做我们平时可以用这个top这个工具,Top这个工具的话,它是。依赖于啊。嗯,Magic serve serve是依赖于这个,这个如果没有没有装的话,你的你top这个命令是用不了的,嗯。我们我们来看一下,我们把它删了吧,为了演示。看我四条。可以。
14:04
我们直接把这个。删掉吧。S。然后再把。也删了。好,我们看一下,现在是这里面已经没有magic和。没有了是不是。然后这个还有等一下。
15:05
然后我听到一个头。嗯。我们把它都删了。然后。就现在我把。嗯,Co states还有magic server删了,然后我们现在来看一下top。No,是不是他就报错了?他说你没有。
16:00
So。不可答,Unable不能请求啊。然后呢,这个呢,Load export和load export我就不不再装了,还有C的Y轴我这里已经装好了,我LOAD01,像这个load export很简单,安装很简单啊,随便网上一篇找一篇文章都可以,它就是一个go里面写一个可执行脚本,然后主要是use level certainport啊。他就是直接启动就行了。然后还有adviser weatherr啊,Weatherr也是一个,嗯,可执行文件。我们来看一下这个啊,就是这样。
17:00
它默认端口是8080啊,你也可以改,就是说如果主机上啊,这种落到节点上的端口可能会被占用8080,你也可以改成其他的啊,这里我就不删掉重做了啊,不然比较浪费时间。然后我们现在来看一下,我把这个M这个再装一下。啊,这个的话。我们直接。嗯。Max可以去下载我看一下。啊,这里一一讲的话就扯得很远了啊,我们可以把。去看一下的。啊,这里可以去下载,也有方法啊,网上网上也有啊,比较简单,就把它下下来就行了,然后然后我们只要改改一下这里用把它的端口暴露出来就行了。
18:03
那我们来看一下。我们我们先把它应用起来,画出来看F点。至于里面每一个像什么授呃创law帮啊,授权啊啊,创建角色啊这些创建账户啊,创建嗯service啊这些东西啊,一讲是讲,目前是一下子讲不清楚的,必须因为嗯K8S的架构确实很庞大,比较很复杂。啊,不是一般的复杂啊,如果说再讲这些的话,肯定讲不过来啊好,我们先。我只是把它应用起来,就相当于你把它当做一个插件来用。啊,应用起来就行了啊。然后呢?我们。CT做完了以后,我们要看一下它的贝。
19:01
啊,我们看一下它绑定的端口。没几个时,我开始这个没有删。没几个时候没有删,就是说它的service是没有删,我们只是删到了他的,嗯,Deployment,然后这个的话它的not port。啊,32115啊,接着这个端口32115,我们来看一下,嗯,其实每个落的节点上应该都有3211。没有值32115没有值的话,就就肯定还是有问题。啊,录制后。他这个是空的啊,有有了。就是说它它生成这个M这个指标的话,它是它不是每秒都有的,你请求一次它就没有了啊。他在收集嘛,是不是他肯定有一个频,有一个频率嘛,是吧。
20:06
好,这个有了,然后我们再来。嗯,没server,因为我们这个还用不了top no这个还没有,我们要把magic serve这个也装起来,你就把收网我们经常去可以买到下面啊,我们要我们为这个在1.8以后啊,我们直接OK。来说。好。嗯,他要等一下。他应该还在收集数据啊。这个装完了以后,我们刚才说的那个r not export啊这些。都有了。
21:00
啊,我们接下来就是。嗯。安装。到这边来安装插件了啊。按照我们先从这个官方的这个插件来来看。官方的这个插件的话就是,嗯,这条命令我本地应该已经下载了啊,装起来可能如果直接在线安装的话,可能也比较慢,我看一下有没有。嗯,对。我按一下。这个插件。这个没有下。下跪呀,没有下完。看一下这里面有没有。里面没有这个,这个插件大小应该不对。
22:04
才1.6兆,估计可能没下完。嗯,稍等一下,我看我本地有没有。嗯,我直接这样再安装一下吧,看能不能把它下下来吧。开始忘记备份了。然后。我们同样我们把把另外一个插件下下来。我们把另外一个插件也装了吧,这个社区的这个插件啊,这个有。ES3A到我们看一下。我们把它移到A塔牢头那个箱。把它重一个名字。
23:01
就叫这个名字。其实。他一叫叫APP,我们我们先来看一下吧。我们来看一下对吧,开始我们一直删这里没删到,因为它这个名字叫这个,但是解压啊,原来也是离线安装的,但是后面这个名字这里少了个APP,所以我们开始在卸载的时候一直卸载不掉。啊,我们保持跟这个一致,跟这个名字一致。啊,这里已经有了,好,我们现在来。嗯。来看一下。我刚才重装了。这个现在。嗯。我们先把。你按理应该不是这样子。刚开始没有三。
24:00
这里这里,嗯,因为我刷新了,它又出来了,你看到没有,我们应该把这些集群的配置给删掉。把这些配置都删了,我们重新来配。现在没有了。你装完了以后,这两个图标就有了。啊,我们先把它本身是disable的。然后这里就是说等待你添加啊disable了以后,这边这边这个图就那个官方的这个图标就没有了。我们看一下这个。啊,这个就是说你装完了以后。两个软件装完以后,其实是这样子,这两边这边都没有。然后我们现在来。嗯,先启用这个。Enable。啊,你没有,然后。嗯,普罗米修斯的话,我把这个数据源,普罗米修斯的数据源很简单啊,我这里已经添加了。
25:01
嗯,普罗米修斯只要配一个地址就行了,9090默认端口啊,配起来就行了。然后待会有一些注意的,普罗米修斯那些配配置要注意的,我待会儿会讲一下。那数据源就很简单,就在这里配配一个地址,填C完test就行了啊。嗯。然后刚才这里已经enable了,然后接下来呢,我们要做的就是。新建一个集群,就是说。我们。要创建一个集群。New啊。这个就相当于也是类似于添加一个数据源一样啊,我们取个名字叫做。假如说叫K-S。叫就叫K。叫COB,他那个叫,另外一个叫Co gra graph,我们这个叫Co。
26:02
APP啊。叫这个名字吧,然后数据员我们选择他。然后这里我们配个地址,这个地址怎么配呢。我们要,我们要使用这个命令,Class,我们来获取这个地址,就是master这个地址。然后接下来我们要配的是,就是说这里是一个大家比较困惑的地方,这个地方我怎么配。啊,这个地方。是吧,这个证书CCRCK这里怎么配?这里其实很简单,因为你看我们平时能执行这条命令,我们我们能执行这些命令请求,比如说get port为什么能返回数据来,这是因为。我们有证书,通过证书来调查的API,然后它是保存在哪里呢?是在master节点上面,是在这里。
27:10
我们来看一下这个文件,我的命令康复。这里面有两个。其实对应的就是这个。Certificate data就是对应的是这个。但是呢,这个我们需要进行BASE64的解压解码。啊,这个比较简单,以此来说,比如说这样。我们BS1倍64分D把它解出来,然后这个就是对应的。是这里。然后另外。我们对这个进行。K进行。这是又是时间了。你来看。
28:04
如果这个证书填进去以后,我们点c test成功了。啊,成功添加这里没有报错。嗯,就表示这个正常了。嗯。是吧?嗯,这个等一会儿。啊,是不是。这就有了。待。啊,至于你看这些已经收集到他deployment,这不里看这个是副本是多少,我们来看一下是。Deployment。我们来看一下这个吧。他才。过去了。
29:02
我们另外再开一个窗口。啊,之前也讲到过的那个explore探索模式,我们来看一下,其实我们就不需要什么查询了,我们就在这里查询就可以了,我们看他能把它查询查询什么出来。啊,这里能获取什么,1234567。三个四个五个六个七个八个,这里有八个。Deployment。这里显示的是上。然后对应的是二。明星空间。所有的。这里显示的是七是吧。那我们拿出来试一下。我们看一下这边计算出来的是多少。这个对应的都是。
30:01
Deployment是不是?HTTP。嗯。这里是求和。The sum。Space看一下。Space。Comp。K。嗯,看一下这个是多少。这是五个。然后。可是他们说五个。是吧?然后。是是七个,你看这里。我们应该这样算。
31:01
一个,然后这里是两个加起来是三个4567是吧。所以,所以是七个。嗯,他统计的是个数。就是说你这个。这个是一个门,但是它这里数量是二嘛,是吧,所以是七没错。嗯,好,这个就是。就是关于,嗯。官方的这个。插件的安装配置啊。然后。下面的啊,跟大家讲一下啊,有一个注意事项就是。有时候他这些像这些标签名啊,有可能已经不存在了,就是说在随着noport,还有sales weather这些工具的,就是说这些设计器啊,它的版本的更新,可能这些名字没有了,所以我们在。
32:01
在查询的时候或。名,名字或者说这个标签没有了。我们在。发现这个没有数据的时候,我们应该去这里面去尝试一下。到就到这个探索模式里面,我们来试一下有没有loadport load CPU,你看load CPU它已经没有单独的是不是这肯定没有了,但是它对应的变成啥了呢?它对应的变成这个了啊,我们可以如果不确定的话,我们可以把它算出来,我们来统计看一下效果是不是它。然后如果确认是的话,我们其实我们就改一下这个就行了,比如说我们改改它改它。是不是啊,是不是这里就有了。是吧?嗯。这一节就先讲到这里,下一节我们再看一下那个社区插件。
我来说两句