00:00
嗯,好啊,来,呃同学们,我们开始上课,呃,那今天呢,呃我们要呃学一个新框架,叫做这个呃Z。萨啊,首先先明确一下,他是干什么事的,干什么事的啊,他呢是呃负责这个监控咱们这个大数据集群的监控集群,呃也就是说咱们在公司里边呢,我可能我搭一个集群呢,可能要有这个十几二台,甚至这个大公司可能上百台上千台的这个服务器,对不对?那呃,咱们每台服务器上面呢,我都需要去部署并且启动好多这个服务,对不对,你比如说要是海doop有什么name node,有data node等等有这些进程是不是,那你要H呢?呃可能有region server有什么master,有这些进程,各种各样的进程,对不对,那这些进程啊,那如果说我某个进程,诶挂掉了,挂掉了,那我作为咱们这个一个,咱们这个一个呃集群的这样的一个,呃运维团队来说,那你需要干什么,我我需要立马知道,诶,哪个节点当中的哪个服务出了问题。
01:05
对不对,哪个进程出了问题,那出了问题我得赶紧的,呃,去给他进行排查,看看他的问题出在哪儿了,然后呢,想办法给他赶紧解决。对不对,我们需要有一个这样的一个一个东西,那谁来帮助我们去完成这个这样的一个功能呢?我们需要一个这样的一个监控的一个软件,对不对?诶我让他去监控每台节点上边的进程,对不对,那谁挂掉之后呢,他得给我能够通知才可以通知到我们,然后我们呢,立马去进行这个修复。对不对,那Z干什么用的,他就是干这个事儿的,就是它可以监控咱们整个集群,然后出问题通知通知我们去进行这个修复。这样的一个东西啊,那其实这个先明确一下,Z比这个东西呢,它并不是说只用在我们大数据领域。它不是我们大数据里边的一个东西啊,它不像什么,不像不像我们前面学的那些什么flu,诶什么后边要喊杜,后边后边要学什么,呃,Spark和这个flink这些东西专门就是我们,嗯,大数据计算这个领域的,对不对,那你像Z这个东西呢,它不它不是杂干什么用的,刚才也说了监控集云对不对,那不管我们大数据需要监控对不对,那你比如说咱们那个业务系统当中,哎,我这个业务系统的服务器。
02:18
对吧,那包括我这个业务系统的这个数据库等等,他也需要我们这个去监控,因为你出了问题也得去修复才可以,对不对,那我们Z呢,也是可以去监控那些东西的。是这样的啊,所以说大家先明确这个ZP它的一个定位,那ZP他通常其实在是给谁用的呢?哎,通常呢,其实是,诶我们这个运维人员去经会会经常使用这样一个框架。运维人员是这样的,那呃咱们这个呃作为一个大数据开发来说呢,其实我们可能以后到公司呢,可能并不会直接让你去诶去干这个事,去使用这个Z,呃但是呢,我们呃这边设这个课程的目的呢,是想让大家这个多了解一下咱们这个就是呃相关的知识吧,相关知识,因为呃有时候同学出去呢,可能会呃被问到呃相关的问题就是诶你们那个大数集群,你们这个监控是怎么做的呀?
03:13
对吧。那这时候呢,呃,咱们就诶使用的是ZPZPS可能用的呃相对来说多一些,当然除了ZPS呢,呃,咱们这种就是类似的啊,类似这种监控软件,呃其实还有挺多的,其实很多啊,有很多竞品就是这个定位是呃相同的对吧,但是各种实现的可能不太一样,其实有很多,那比如说大家呃可能说多了还不知道,但是有一个大家可能之前用过。叫什么叫做呃,Gangli gangli大家在学习的时候是不是学过一个flu的监控软件啊对不对,Gangli,诶那其实GA格Li呢,诶也是跟我们扎克S是诶相同的这样的一个框架,可以监控咱们的这个集群,诶包括什么监控集群的资源诶监控这个集群的进程诶都可以,那Z比克呢,跟他。
04:03
的功能其实是很相似的,功能很相似。所以说呢,呃,大家知道咱们Z皮克S呢,它的一个定位就可以了,诶知道一个定位就行,然后Z皮克S呢,它为什么就是说呃,我们在这要要学一下这个Z皮克S呢,就是Z克S呢,它要比我们大家前面接触过的那个刚格裂呢,呃,他的这个呃用户界面呢要更友好一些。用户界面要更要好一些啊,就是呃,首先你你使用ZP的时候呢,呃全基本上全是在页面上进行配置,所以使用起来非常的方便,那其次呢,ZS呢,它诶给我们提供了一个可视化的一个功能。就像谁,就像我们前面学那super赛的,Super赛当中,我们是不是可以有这个报表啊,报表去展示什么,去展示咱们自己统计的数据,对不对,那ZS呢,它也有一个这样的一个这个可视化的一个页面,那它的页面上展示的是什么呢?页面上展示的是你监控的那些那个进程,包括你监控的那些资源,他能够通过可视化的方式给你展示出来,那也是你在页面上呢,能够实时的去看到,诶你监控的整个集群的这样的一个资源的使用情况,还有进程的这个运行情况,你在这个页面上都能看到。
05:12
诶是这样的啊,这是Z皮克斯呢,诶它的一个这个优点,一个优点啊好,那咱们先简单的讲一讲这个杂皮啊OK,那完事之后呢,呃,我们呃录一个视频吧。
我来说两句