00:01
前面我们已经完成了库op s fair的最小化安装,我们也看到了这个控制台界面,那接下来我们就来做一个完整安装,把它里边我们后来要用到的一些功能组件我们都来开启一下,那这个完整安装除了我们这个第一次来执行的是完整安装外,如果我们现在已经最小化安装了,我们也可以使用它这个可插拔组件的方式来给里边再加一些功能,因为最小化安装的时候呢,它的这个安装文件其实是这样子的,我们来给大家看一下,之前呢我们都来看过这个最小化的安装文件,它里边呢有好多的配置项,这些配置项都是来指定开启哪些功能的,我们这一块配置文件呢,也都说的很清楚,我们可以点进来,在他的这个官方文档里边呢,都会说我们每一项的配置是指的开启哪个功能,那我们来参照这一块的文档,那我们现在要开哪些功能,首先在可插拔的组件里边,它有第一个功能应用商店,基于这个open patricks其实。
01:01
对于我们这一块文档来说,那就是在这,那它的这应用商店呢,就是这个open patris,我们把这个呢就关了就可以不用了,因为这个应用商店呢,目前还不是非常完善,它内置的这些应用呢,生产环境也没法用,但是开发测试呢,用起来也非常不错,给大家一个学习,那我们这个等它的所有应用商店里边,真正的做一个成套的应用商店产品了,我们还非常有必要去来使用,好,那现在这个应用商店我们就可以给它关掉,还有这个DVOPS系统,这个David维OS这个系统呢,我们现在一定要开启它,你们现在最希望体验的就是库S菲尔给我们带来的整个一站式的David维OPS系统功能,也就是它是基于金克S来给我们提供一站式的流水线,让我们能自动化的运维部署我们所有的信息,包括这些代码,质量管理、监控等等,所以我们希望呢,有咱们这一个CICD持续集成,持续交付的。
02:01
的这个系统,那么就把它打开,然后还有我们的这个日志,日志呢我们把这个呢就可以暂时关了,因为如果全都开的话,内存还是挺大的,这个日志里边呢,有我们容器里边各种负载的这些日志,而且有了日志以后,我们还可以用它的这个service match功能,它的下边还有一个service match,这个功能呢,可以帮我们来做灰度发布,链路追踪等等,其实这链路追踪包括我们的限流以及熔断这些,在我们自己的spring cloud微服务解决方案里边,Spring cloud阿里巴巴这些已经都有了,所以把这个servicemash这个东西呢,我们可以暂时先来给它关掉,而且呢,我们service慢,你想要开就一定得在这开日志,它这也提示的很清楚,不开日志的话还不行,然后呢,接下来我们的告警系统,我们要打开我们还有的这个matrix serve,这个matri serve可以基于我们这个性能监控指标。
03:01
来给我们动态弹性伸缩应用,比如这个CPU占用率高了,我再来把这个应用给别的服务器部署一个CPU占用率下去了,我把别的服务器的那个应用可以给它删掉,但这个meri server呢,我们现在安装的话,还得额外安装一下meri server里边的其他东西,这个呢,我们暂时就先不开启了,然后还有我们的这个其他的这个组件,那最终我们就应该决定是这样子的,在我们的这个最小化安装里边,咱们它默认好多都是force的,我们应该。把这个etcd它默认first,好,我们现在不要了,这个common,这个common这一块呢,我们还是默认使用这个me serve我们就不要了,这个控制台我们留在这儿,还有monitor,我们的这个监控系统,其中最小化安装,看到这个界面都已经有这个监控系统了,没问题,那么这个监控系统呢,还给他留下,然后还有我们的这个日志,我们就不要了,然后open patricks应用商店也不要这个David OPS,这是我们的整个一站式的自动化流程系统,我们把这个呢要留下来,我们把这个整一个处就行了,然后剩下的servicesh我们不要了,然后呢,系统的告警与我们这个通知系统,我们把这两个呢给大家可以来开启一下。
04:15
那现在呢,我们就可以来这么开启这么些组件来做一个完整化安装,当然完整化安装不是所有全完整,我们开启了一些我们想要用的组件,那这些组件呢,我们最终想要选组件安装怎么办呢?参照这个文档这块说,我们安装以后,如果还想开启我们某些组件的这个安装,那我们只需要呢,修改一下,我们这个叫con菲map,使用这个命令库包controller edit修改,修改什么呢?我们的con菲map就是配置文件的这种,然后呢,我们这个配置map里边,我们只需要来指定哪个功能呢,再开启,再不开,然后我们这个文件只要一修改ks installer就会重新的再给我们装一下,好,那我们就来执行一下它,但这个执行它之前,我们应该扩充一下我们这个节点的这个内存,这个内存呢,默认这个4G还是不够的,我们就算挑了一些安装也不够,那我们现在来扩内存,我可以把这三台机器呢,先都全部关掉。
05:15
好,我直接来关闭电源更快一点,然后呢,我们接下来应该这样,我们在这个NODE2节点,Master节点我们就不用扩了,因为这个master节点呢,我们现在什么都不做,它只是一个调度系统,我们真正pod之类的存储,我们都要存储在NOTE2NOTE3,所以master节点的这个处理器内存都已经足够了,我们来到NOTE2系统,NOTE2系统呢,我们来给它修改一下,修改一个它的这个内存,我们来给它调到11g 12g左右,好,我们就来调个11G吧,这个内存呢,调到11G处理器我们来拉到六核,然后我们的NOTE3系统也一样,把这个内存呢,我们都给它调大,调到这个11G肯定是够用了,然后呢,我们这个处理器我们来给它拉到六核二,OK,好,我们把这个系统呢,都来调整好,来让它重新启动,那重新启动起来以后,那接下来就来使用这个命令修改一下它的con菲map这个配置map,把这个配置MAP1修改以后呢,那这个就会。
06:15
重新执行我们的整个安装流程,好来等待他们这个重新启动成功,来先连上咱们这三个节点,现在这个master这个节点呢,连上没问题,那知道NOTE3现在也是连上的,包括我们来看一下这个NOTE2 note2是什么问题,好NOTE2呢也是起来的,那么这一块稍等一下肯定就会连上,那我们可以自己在这儿,我们来打开这个NOE2的连接,好,我们现在来连上,那连上以后呢,我们接下来在master节点,我们现在就来使用这么一条命令就行了,但使用这个命令之前,那等master节点这些都准备好,一定要确认get notes,好,我们所有的这个节点都是ready状态,没问题,然后呢,我们再来get ports杠杠all namespace,我们看一下所有名称空间的这个ports组件都准备成功就行了,好,那现在呢,这有一些error,我们呢就来等一下,那肯定就是我们这个上一次的异常关机,让很多组件呢都变成这个。
07:15
啊,Error状态了,但是它这一块呢,稍等一会儿就修复了,那么这个Co ne集群最强大的能力就是它的自我修复,即使某一个节点这个东西出故障了,它会呢重新拉起再来执行,那么就来等上个一两分钟左右再来看一下就行,好,现在我们来再确认一下好,我么这一块呢,有几个还正在初始化,但其他东西呢,都已经是running状态了,我们再来确认一下,好,现在呢,所有东西都是running状态,没问题,那接下来我们来修改一下我们ks installer的这些配置,把我们要的功能组件一开启就行了,在这来点一个粘贴走,然后我们要开启的这个功能,我们先来准备一下,首先第一个matrix server,好,我们还是不开,然后呢,下边的这个conso控制台监控默认都是开的,日志我们也不开,好留在这儿,然后呢,Open patricks也不开,这个David OPS,我们这个呢一定要打开,我们接下来就要体会的就是它的整个。
08:15
动化的部署流程,所以我们把这个打开,包括我们在这儿可以来做一个限制,它在这一块呢,是金克S,我们这个内存的最大,最大呢它限制到两个G,然后内存的初始化申请,它限制了1.5个G,我们可以让它一开始呢申请个一个G就足够了,然后剩下的这个配置我们可以留在这儿,包括金克S的这个券大小,它的这个持久化保存的这个文件八个G,然后剩下的这个还有一个这个sona cube,这个是做我们这个代码质量检查的,大家想打开呢,也可以在这来处打开好,然后这个service match微服务治理我们就来关掉,然后我们的这个通知系统,告警通知系统这个处出,以及下边这个我们也都变成出,那这两个做好了以后呢,接下来我们ESCWQ退出并保存就行了,那保存完了以后呢,那接下来我们就来等这个KS整个安装,这安装的过程监控跟我们之前来做这个最小化安装也一样,点过来。
09:15
我们可以使用他的kste的这个日志,我们看一下它执行到哪一块,把这个拿过来走。好,那现在呢,它就执行到这一块,我们就来稍等一阵。好,我们大概等待呢,20分钟左右,我们这一块cooper fair就安装完成了,这块控制台呢,说这个欢迎我们这个cooper s fair,然后来访问这个地址,当然这个地址呢,是我们这个跟外网访问的地址,我们这个宿主机只能拿我们这个192168,我现在来重新来测试一下,还是我们这个单是bird,我们来刷新,好现在我们这个界面重新展示过来,来me登录一下啊,这个密码呢,就不用它这个默认的,由我之前在库s fair刚安装完,我们我把这个密码已经最小化的时候修改了,我们现在来用我修改的这个密码来做,那如果大家没修改的话呢,就可以用它默认的。
10:38
好,我来登录进来,那现在呢,这个就是我们这个cooper的完整安装,我们看到了这个效果,现在它的这个统计界面还是这样,我们这个企业空间项目这一块呢,都有,还有我们的内存指标信息,那么就先来熟悉一下整个这一块的界面,那么后来就通过这个界面来操作我们所有的cuber ne集群,首先我们这个界面一开始呢,是我们整个工作台,工作台这一块呢,都是一些指标信息监控,比如我们有多少个企业空间,那这个企业空间是什么,这个库珀S菲尔认为我们呢。
11:16
所有的项目都应该所属于某一些企业空间,比我们来点进来,它默认的这个企业空间呢,叫system workpace,那这个企业空间它是一个组织,我们这个项目和David维奥S工程管理资源以及团队内部的逻辑单元。那说白了,我们一个独立的团队就应该有一个自己的企业空间,比如我们艾特硅谷,我们这个上硅谷下面呢,有非常多的这个项目,比如我们这个商城,还有我们的鼓励教育以及众筹等等,那每一个项目呢,都是由一个团队来负责开发,那我们就可以为这个团队来创建一个企业空间,让他们在自己的空间下互相自制管理,那你不属于这个空间下的别人,你就算登录进来也没什么用,所以我们就应该有一个企业空间的概念,来隔离我们这个不同的团队项目,好,这样呢,有一个企业空间回到工作台,接下来呢,就是我们说的这个项目,那项目呢,每一个。
12:17
项目都需要所属一个企业空间,那我们默认安装的这个cooper s这些项目都是属于system work space我们这个企业空间的,所以我们现在的这个人呢,我们这个是dmin,那如果是别的用户没有我们这个企业空间的这个权限,那他就还不能操作这些来点到工作台企业空间完了以后呢,还有这个账号,账号呢指的就是我们当前这个用户,那当前呢,就一个呃的命用户,他的这个平台角色是什么,这块呢都有,以及来看下边这一块的整个监控信息,那节点状态,三个节点呢都在线没问题,而且每一个节点点进去都可以看到。还有我们的存储类型,我们之前安装了open EBS,这就是我们相当于挂载的这些磁盘,我们主机里边呢有多少,然后呢,每一个主机节点点进去,我们都能看到它完整的信息,比如我们这个主机的CPU的这些指标信息,以及它的这个容器组里。
13:17
但呢,跑了多少个容器组,也就是我们这个port的信息这块呢,都会有在这儿提示,而且每一个portt呢,它这块如果有任何问题,我们在这儿呢,还可以看到它这个状态,这个状态呢是旧绪中,所以有任何问题呢,它这一块还会汇报来点进每一个里边也能看仔细看到它的详细信息,包括有些pod里边,比如们来点进去还能看到它的容器日志,那这个呢,就是我们它的容器日志,还有我们整个的这些调度资源信息,以及这些监控指标,环境变量,我们触发的这些事件,我们这一块呢,全部都可以监控到,那来到我们主机,每一个主机里边的详细信息,我们都可以通过这个控制台来监控,再来到我们这个工作台,然后呢,这是我们这个主机,然后接下来就是我们现在开启的功能组件monitoring,我们的监控系统开启的cooper fair以及cooper notice来点进来,每一个系统里边它正在运行的这些状态都有,特别是我们这个DAOPS,把这个工程呢,现在是。
14:17
在启的,那们后来就可以使用它来体验我们整个自动化的部署流程,好我们还是回到工作台这块,是我们的整个资源占用信息,那可以按照节点用量,企业空间的这些用量来进行一个排列,这是我们的整个工作台信息,都是一些监控指标,那最终啊是来到我们这个平台管理,这个平台管理里边呢,接下来这边呢,就会有一些操作界面,首先第一个企业空间这个界面,这个界面呢,就可以让我们自己去来创建一些企业空间,我们说企业空间就是为了隔离我们这些团队之间的,然后呢,还有接下来的这个项目管理,那项目管理呢,相当于我们有了企业空间以后,每一个企业空间下呢,就会有一些项目,那我们现在这个命,这个角色呢?他现在还创建不了项目,因为现在的这些企业空间都是system work spacece。
15:10
他呢,只有权限在这来进行一个检索,然后呢,那接下来就是我们的这个账户管理,账户管理呢,就是可以给里边来创建一些角色,来创建一些用户,还不是角色,我们创建用户,那创建了用户才能登录进我们这个库,S菲尔这个系统,而且呢,他在。这一块账户里边他还结合了这个角色做了一个RBAC这个权限控制,所以呢,有了这个RBAC,我们可以把这个权限呢,控制的非常细,非常死,这样的话呢,不属于我工作空间的,可能不属于我这个项目组的,登录进来呢,就没什么用,然后呢,而且我们通过这种权限控制,也能避免我们非常多也不安全的这个因素发生,最起码一个非相关的人员,即使登录进系统呢,它没有权限,那他就不能对我们整个平台的资源来做一个增删改查这些捣乱,好这是我们的这个账户管理,还有这个平台角色,平台角色里边呢,也有非常多的这个角色,而且我们。
16:11
下一节课还会仔细的来说这个事情,这是我们的这一块,主要在平台管理里边,就是我们这几个,相当于我们来创建这个namepa,我们这个企业空间的这个name呢,不是我们以前cooper nese的name space,这就是我们类似于eclipse的工作空间一样,然后呢,还有我们的这个创建项目的账户的,还有平台角色的,那这一块是平台管理,接下来是我们基础设施,基础设施里边呢,就相当于列举了我们所有的这个主机存储类型这一块的详细信息,每一个点进去呢,都能看到它的详情,然后我们的这个基础设施,这个完了以后呢,下来是监控中心,这个监控中心呢,有非常多的更详细的内容监控系统,比如我们这个物理资源的这些监控,CPU的平均负载,磁盘的吞吐量等等等等,还有我们这个APS server被调用的这一块监控,以及我们调度器这一块的监控,还有我们这个节点用量排行,所有整个的监控系统在这都有,包括我们这个应用资源。我们现在当前。
17:11
我们整个集群里边有多少个企业空间,多少个账号,多少个项目,多少个自动化部署的这个工程,以及我们这个CPU的占用情况,以及我们现在在我们整个集群里边有多少个部署,部署就是我们以前说概念的时候,我们创建的deployment,这就叫部署,然后呢,有多少个有状态副本级。比如my circle red那些都是有状态的,有多少个是守护进程的,一直在运行的,还有多少个任务是调度的,还有这个定时任务,以及我们存储券持久化的,还有我们多少个服务,我们之前测过我们这个service,这个服务呢,就是我们说的service service就是来对外暴露我们这一组,我们这个portd的,还有多少个路由容器组,这一块呢,都有,那所有的这些指标信息这块呢,还有我们这个告警信息,包括我们还可以制定一些告警策略,比如我们这个CPU,我们随便来写一个策略,你的这个CU我选来选了一一个节点,说你的这个CPU呢,假设超了多大以后我就给你报警等等等等,所以们这一块呢,后来还会给大家演示,这块是我们的这个监控系统,还有我们的服务组件,服务组件里边呢,展示了我们所开启的这个所有功能,里边正在运行的这些服务,要保证的每一个都是正常状态。
18:29
那这一块完了以后呢,接下来就是这个平台设置,这个平台设置呢,主要来设置我们的这有一个邮件服务器,邮件服务器后来我们会来结合这个监控平台,那设置好邮件服务器呢,它就会触发相当的告警策略,只要有了告警策略,就会给我们发送这个预警邮件,那这就是我们整个控制台的这一块介绍,那也没什么操作的,我们后来主要的操作要结合库s fair,我们这一块的整个快速入门,特别是我们下一课要创建一个多租户的这个管理系统,然后我们现在要创建好所有的账号,把权限控死,不能让任何的人全部都进来,对我们整个集群资源来做增删改查,那下一课呢,再说这而且呢,特别来注意一点,我现在呢,这个集群我们后台呢,全部运行好了,而且我提前也给它准备好了,这个隧道我就不给打开给大家看了,这个隧道呢,我现在就直接来到我的这个主机。
19:30
那我就不连接远程主机了,我这个隧道已经搭建好,然后呢,我只要以后访问这个网络地址,我们呢就可以直接访问到我们的虚拟机,所以我以后呢就不打开这个虚拟机界界面了,我以后就直接在我的这个网络地址这一块来进行操作就行了。而且呢,我们这个可视化界面还有一个激动人心的功能,比如我们来登录进来,那使用ad密我们的账号密码,那登录进来以后呢,我们在这儿如果想要做控制台,我们以前要连上远程电脑插线,但在现在呢,我们这一块直接有一个cooper controller来点进来,所以以前呢用的什么命令,在这还直接能使用CU controller,用来get notes获取我们的所有节点,这个状态呢,有包括CU controller,我们要用的这个查看所有port的信息的,我这个get ports等于咱们这个杠杠or namespa的,我们在这儿呢都可以来进行运行。
20:31
所以前能执行的命令在这呢都是可以的,这是我们的这一块,但我们必须是adin的情况下,其他用户没有这个系统权限的人,我们在这一块肯定不能执行我们这个集群命令,要不然大家都进来能执行,那就把我们整个集群就搞破坏了。
我来说两句