00:02
大家好。上一节视频我们讲到了。的。一个官方的插件。关于。哦,KAPP。不过这个插件呢,已经有两年没有更新了,然后还有一个社区插件叫。Co。这个插件呢,嗯,是基于。嗯,的官方插件。嗯。就是APP这个更新版。然后它也是可以用来监视。集群。的一个性能。然后展示主要的一些服务。一个指标。然后。我们现在来来看一下它依赖的环境。嗯,同。
01:01
和CAPP这个一样,需要安装,需要提前部署好普罗米修斯。Not export。还有cot state magics。以及magic server。这些。嗯,常见吧。然后。配置的话,就是说数据源的配置。嗯。也是同上一堂课一样。啊,然后Cora它有依赖于,嗯,一个拍char,就是我们之前也讲到过了,就饼图啊,因为他在dashboard里面有一些地方是用到了丙图。所以我们要提前安装好这个插件。然后。嗯,前面的普罗米修斯这个数据源的配置都一样的配置,然后到这里来添加集群的时候,然后我们来看一下。
02:04
啊,这个是上一堂课,我们上一节视频我们讲到的。啊,这个官方的这个插件,你看它的效果就是这样子。啊,它这这个OVER6这里总览,这里能显示就是集群的dashboard节点的dashboard,还有port container的dashboard,还有可以详细去浏览每一个命名空间下面的,比如说default命名空间,或者increase NG X。或者是Co not的例子,Co public Co system,还有Co not这些命名空间下啊有什么,比如说。啊,有哪些啊。嗯,有哪些破子,你看没有,这些效果都出来了是吧。然后。还有一些schedule。这三个组件的状态都是OK的,然后节点的状态也是OK的,对吧。
03:04
其实我们只要嗯,修改一下啊,一些度量指标啊,这个这个插件还是可以用起来的。那我们现在再来看一下另外一个插件Co。我们在上一节视频已经把它安装好了,然后我们这一节课呢,把它enable起来啊,Enable点击enable以后。点击以后,我们接下来就是。配置一个配置一个集群。啊,我们点这边左侧这个塞坝这个侧边栏,然后class,然后爱的一个class。然后这里叫做我们叫科波。就叫我可吧。可不可?然后这个地址的话,还是同样的方式来获取。嗯,Young four。
04:12
然后这里还是要开。把证书给。配上证书的话,我们就参照上一节视频中讲的获取到的。我们来把它粘上来,你也可以。嗯,参照,嗯,这个插件的官方说明,它是另外创建了一个角色,然后创建了一个账户,然后和角色,然后授权。然后我这里就相当于用命的。一个权限了啊,权限比较大。这里只是演示啊。然后我们点。这里数据源选择普罗米修斯,然后我们来特哦,他这里报了报了这个400是吧。
05:01
我们来看一下是什么原因。啊,我们这里Skype跳过。再来,我们再来试一下。谢谢。K。可能开始添加的时候有有点问题,我们重新复制,现在就已经啊,等一会儿。
06:02
等会他应该就有了。听得到吗?我们重新再添加一下,没有添加到。
07:04
啊,它这里提示已经添加了。应该是这里没有加载出来。我们刷新一下吧。就是没有刷新它这里。刷新了气了,好,我们来看一下。嗯,它这里提示。嗯。其实他这个比官方的那个更详细,你看因为我刚才是。在讲完上一节视频的时候,我模拟做了一些。嗯,资源的限制,然后你看有一些资源,我模拟它获取不到CPU,因为我给的。嗯。你看没有。他这些是有一些是获取不到的,获取不到资源的,他就是处于配定状态,他这几个一直处于配定状态,因为我们来看一下,因为我给了他的。
08:05
哦,MM4吧。白毛四。嗯,这个是。这个是可以的,三。嗯,因为我让他是嗯request请求六核CPU,六核的CPU他肯定请求不到,因为我这里核数没那么多,你看。我这里才四盒,他要请求六和啊,就最小最少要六个和request啊,请求就是说这是一个memory,就是说我这次请求分配的最小内存是128兆,然后核数的话是六核。然后最大限制的话,内存的话是512兆,然后是八核,它肯定获取不到的,然后这个100M就是毫它。
09:00
啊,一盒等于1000毫啊,是这样一个单位,然后这些的话都是有问题的,比如说。然后我上面还模拟了啊,有两个失败的,嗯,这两个是失败的,我们可以看一下他失败的原因。我们来看一下这个18等于一。如果是默认的命名空间的话,Default的话,我们后面就不用接,如果是非default命名空间,我们后面还要接,刚才来看一下,你看它的失败原因,我们来看一下啊,我这里是随便写了一个。他的是crash。应该是这个命令有问题啊,啊,我因为这个是本身就是想模拟它,让它失败的啊。所以我们现在。嗯,先我们来看一下从南。然后一会儿我们把这些删掉,或者说把配置降低,我们来看一下这里会不会恢复起来啊。
10:07
然后这是落的,你看它这里就显示了哪些是失败的是吧,两个失败的。在default命名空间下。然后我们还可以点过去。嗯,到对应的。这里就跳到了对应的。嗯。这个是这个坡的下面来。Play the box。我们看一下。他的名字叫。嗯,APP标签是类Bo是吧。128兆内存。我们再反回去看一下。嗯,这底下的也有开和开始我们演示的差不多。状态也是active。
11:01
然后我们再来看一下no open6。落的这个地方的话,它是。啊,说这两个是失败的啊。然后MASTER01的配置。嗯。然后破limits。这里没有配。Request这里这里没有和request这里没有na,然后这里它已经获取到了。然后再落个零一。或者零一下面这个是失败的。他这里有这个失败的信息。然后我们再来看一下。单细胞的。他的话,我们我们看到上面是不是这里又没有数据,我们来看一下原因。这个这个公式其实写的很复杂是吧。你看它这里写的是什么,它这里是not加port instance,所以这里要有一个要注意的是,就是说我们在。
12:05
嗯,配置普罗米修斯的时候,我们我们不要去,我们不要去配置在那个诺德export下面的话,9200下面我们不要去打instance的标签,我们就是默认。只默认默认instant标签的话,就指的是他里面的这个。好,我你看我这里没有配instance的表情,我配了一个no name和nod no name和nod的话,嗯,有些地方就是说在官方的那个插件里面,它有的是用的notd name有的用的not的,所以我给了这两个,把这两个标签都打在里面,这样的话我可能就是说,嗯,有些panel里面我就不用去改。啊,这个标签了,就直接可以用了。好,我们来看一下为什么这个不行。它这里是na,我们看一下。这个没有。
13:03
这个。那他有是吧,能获得到这。我们看到他们获取的是。然后是等于这个。Job。ICPU。然后。我们来看一下有没有叫一个标签。嗯,他下面是有交过这个标签。好,我们看一下其他的人。零二也没零也没,那这里肯定是有问题。我们一会再看一下,先跳过,然后我们看一下其他的有没有数据。这个也没有是吧。我们来看一下这个,这个的话它取的是也是诺的CPUC。
14:00
这里一直有七八字。The house。我们看一下他这个标签有没有问题。Not host。你看host是到二幺。因为我们刚才这里选的是二幺,所以他出的是二幺。没有问题。9100端口也没有问题。E。九。Job的表情有没有问题?叫法是CPHPH的话。这个是五幺的,我们要二幺,我们来看一下,我们直接把它粘过来看一下。表情。
15:03
为什么他获取不到值。然后我们把instance改成。幺九二点幺六八点。09.219100。然后叫过的话。我们先不写胶布,你们看一下。我们就会用点心吧,我们看有没有吃。9100。它这里是有次数十三。
16:04
By instance。来看一下他的酵母是什么,应该是酵母不对。他这里交的是K8S。我们看一下这里。
17:08
因为这个脚本他可能没有取到。我们要把另外一个过滤的。叫我不对。这个地方。他获取的交火。他获取了两个。嗯,我们看一下。我们直接匹配他。啊,是不是全部有了。他他开始没有迟到,所以这个代我们也要这样改。然后这个应该也是一样。我们看一下这个这个有没有。
18:06
就是我们在利用这个explore这个工具啊,逐一的去调试啊,把这些。结果。就调出来。这个也是一样的。他应该。刷新应该就有十只了是吧。刷新就是。就我们我们。五秒钟刷新一次,让他把数据加载出来,应该其他的也一样,现在都有数据了是吧。然后。啊,这上面也都有了。然后swap的话,我们因为没有swap。没有袜子,所以这里是没有的。我们来看一下。他这个监控的。力度很细。其实。有一些指标呢,啊,可能。
19:01
其实用处也不大。你看这里面非常多的指标。这个我们就改好了,我们可以保存一下。我们再看一下其他的几个代细胞。嗯,这个是落的原因,就是刚才没有展示的原因,就是因为我里面的啊。啊,落的节点就是打的那个标签。有两个,一个是K8S的,另外我有三台主机是SF,它不属于这个集群里面的,所以它也获取到了另外一个标签,所以导致这些没有展示。我们在我们在普罗米修斯里面打标签的时候,我们要设就是默认不给。不要去说。因为它这里我们来看一下它的变量,它的变量里面就是取的就是。
20:01
IP加端口号,你看这里取的9100端口,然后他还获取到了他的。他的的。Host是吧,选了这个IP。这是要注意的。然后我们再来看一下。Port。破的里面基本上。这里面都有了啊,当前总共的的次数。就是这个这个container被box rest了多少次,我们来看一看是不是这样。啊,是不是12次是吧。就是这个b box。对应的这个破的。重启了多少次?那我们再来另外看一个。
21:00
就是说落的破的deployment,我们来看一下deployment deployment的话,它这里啊,就是说。当前。当前这个。Default里面。这个。里面因为我模拟它就是两个失败的啊。啊,我这个也是测试啊,这个就是成功的三个,这里两个是处于三个是处于配定状态啊,我们来看一下。这个我们来看一下,对的。他在下面的话,这个是。N X test X test,它这里不是希望要三个,但其实。Reading。And test。
22:05
N test它都是处于配定状态啊,它不是就绪状态的啊。好,这里都是零嘛,是吧。TEST2 test2是正常的。好,我们现在。把这几个删掉,就把有问题的,把有问题的这这几个删掉。把这个,然后。这个有三个。或者我改一下吧,我允许他调度,我把它改小一点。改成等于我两个相等,看一下行不行。
23:04
看能不能被调走。我。嗯,现在还有一个是处于。Container creating状态。我们一会看一下是不是这个。这个还还在创建中。这个是test。可能也有可能资源不够,我们来看一下。看他为什么一直处于陪定状态。啊,状态是陪你。
24:01
然后他是在waiting,然后原因的话是拉水镜像失败了,你看没有。I pool。然后image破,他要拉NGX。的这个镜像失败了啊,在诺顿。在落到零一上面,落到零一上面没有这个音效,我看一下。嗯。落在零一上面,落在零一上面,没有这个倾向。我们可以把这个标签,我看他有没有。嗯,他已经money了,已经拉就下已经money。嗯。啊,他已经拉下来了啊。那你看这边已经状态就是正常了。失败的那个我模拟失败的那个我已经删掉,然后我们这个时候再来看一下激情的状态。
25:05
啊,它是NOTE01的,它这个。他这个是超过50%,它这里状态就是显示就是有预警了,我们把落的零一。落落,我们删除一些资源吧,可能资源不太够,嗯。我把M3的删掉吧。然后把。M4的有三个。看一下老师落落的你现在。
26:01
名一。啊,把这些酸属于。这个状态的,等他上完。他已经没有了。我一会儿再看一下。嗯,是吧。他超过50%,他的状态就是这里就是黄色了,就开始警告了。这个就是。这个插件。嗯。怎么说呢,各有也相当于各有优势吧。我们可以。其实我们要用的话,我们可以把它里面的dashboard里面的我们期望的这些。嗯。因为我刚才已经把它删了,这里没有了。啊,我们把就是找这个公式啊,我们需要的这些公式把它找出来。就是说。
27:00
到我们假如说我们需要监控什么的,我们去参考它的公式是可以的。像比如说这个。这个有时候它这里加载比较慢。就不出来。抽风一样啊。你看下面的这些又没有出来了状态。所以。啊,大家可以根据自己的情况去。来使用这两个插件。
我来说两句