00:00
那张图啊呃,然后呢,安装好之后对吧?然后呢,我们去看一下这个监控信息,然后这个时候看之前我们启动命令是不是到这就没了对吧?正常的那顶多加一个到这吧,日志打印到控制台对吧?啊志打印控制台,这是我们最早的那个服务吧,哎,这个服务怎么叫这个名字,我记得应该叫这个名字吧,你们记得就第一个官方利福们的钱吧,来看一下啊,你们不记得是吧,是在前啊第一个官方案例嘛,对吧?弗在前稍微的去调一下啊呃,然后接下来更要指定的是monitor监控啊,监控类型用杠利啊,然后监控把数据发送到哪,发送到102的8649端口是刚链的一个端口号啊,然后呢,我们把这个拿过来去运行。哎,错了出来好,他是logo house44对吧,然后接下来呢,我们去往里面发数据,这个得正常用啊对吧,NC走你数据是通的吧,对吧,那接下来呢,我们还是去,哎错到这来对吧,刷新我们的页面。
01:25
啊,刷新页面这个我们就有的东西,不要就给它收起来啊,这个东西没有用对吧,CPU我们暂时也不看啊,因为如果说真的监控是不是多了一个,刚才有看到吗?没有了,现在多了一个,好这里面呢,主要呈现的是这几张图啊第一个。这里边这里边用不了红笔比较麻烦。我切出来,然后呢,我们用红笔了,在这不行就用不了红笔了,它有快捷键冲突这里边啊啊,那我们就直接这样讲一下啊啊,因为大家到时候大家看视频的时候有黄色标记是吧,这个鼠标这块啊,就不用碰闭了,这个叫China的容量对吧?China容量啊,然后我们还关心的China当中一个size,这容量是根据事件来的,有多少个事件,这是大小对吧?啊China size,然后跟这个地方叫put temp。
02:25
这个叫put success对吧?那么下来还有这个叫take time count,然后还有一个take个success count,对吧?我们刚才是不是发了一条数据啊,因为这个咱们虚拟机啊,它通信比较慢,我们再刷新一下啊,我们得看到有数据,至少得有一条数据成功吧,有了数据了吧,他过来的比较慢啊,虚拟接过来比较慢,因为监控它都会比较慢啊好,那我们接着这个来聊,主要的我们看到这个内容,然后启动时间跟停止时间,启动时间有停止时间肯定没有,因为我们还没关对吧?啊肯定没关,那我们主要的图我就不对着这个聊了,就对着这个,因为那里边用不了红笔,主要看到的图的样子当中呢,有这么九张图,分别是这里边内容我已经给大家改出来了,对吧,那这个里边我们需要关心的指标呢,这四个。
03:19
以及这个。这五个我们需要去关心的,而且有中文解释,其他的你该都能看得懂是吧?那大家想一下啊,这个是叫什么尝试负的,这个呢成功的,这是尝试T的,这个是take成功的,对吧?好,那正常如果用一个对一个正常的系统而言,是不是应该它们俩相同,它们俩相同,那如果不相同的时候,谁大。总总的大的大,尝试的大吧,尝试的这个数字会大一些,如果说你发现远大于它,或者说甚至平均概率啊,这五次成功一次大概这个概率,那说明什么问题啊,数据丢失啊,嗯,这个能看出来数据丢失吗?
04:18
这个看不出来吧,他在重试啊,不能说他尝试不是重试吧,他尝试了好几次成功了,终于成功了一次。说明系统资源可能不太足了,因为经常失败嘛,失败要重试对不对啊,要资源不足了,同理他们俩之间是不是也一样的,对吧,如果说差距比较大,是不是也能说明咱们的一个性能机器性能不太好了,那遇到这种问题怎么调呢?就加整个form a的内存。那A的内存在哪加呢?在这啊。我再开一个CD的OD Mo里边它呢会有一个康复目录,这里边呢有一个Inv.SSH,但是它是模板,所以说你要用的时候是不是把它去掉。
05:09
是不是把它去掉来打开,或者说咱们这啊vm from env.S才是。这里面呢,它就会关于环境所有的一个配置信息,这当然它现在是注释掉的。着调的对吧,这个是就指定Java的一个什么参数,就是给我们启动加va进程用的,那这个指的是。这启动的时候他需要有参数的,这个是最小内存,这个是最大内存,最大内存就是说一启动的时候,我先给你申请。100兆内存对吧,如果不够的时候我再申请,一直直到到2000,如果你还不够,那就没了。对吧,啊,那就没了,那就不够用了,所以如果你要改内存的话,把这个注释给他干什么?干掉改造改掉可以增大他的内存啊,当然还有一个前提啊,就这个文件你把里边改了,这个东西你没有干掉,他会用吗?他用不了,它是模板文件,他不会读它啊,它不会多大,他读的是F-Env.SSOK吧,所以你要用的时候把它干掉,这是我们说的第一块,如果说你发现这两个东西数据量有大的差距,或者他们俩数据量有差距的时候,可以去,基本上可以判定是资源性分体。
06:34
那还有一个刚才有同学说了,呃,尝试的跟这个成功的丢数据的问题,那这里面能不能看出来丢数据的问题。仔细想一想来看这三个属性啊,可以看到啊,应该这个。
07:05
你看这个这是总容量,这个没必要看看这个size对吧,啊总数量。那得怎么看啊,如果没有丢数据的情况下,那么你不的成功的是不是应该等于take成功的,加China当中现在有的能不能捋明白这个数据关系,这个没问题吧,如果你有丢出去。就是已经传进来这数据了,那也能看出来吧,能看出来,但是呢,它俩完全相等,就证明就是说如果说它等于它加它就能说明它一定没丢出去吗?不能,就是因为我们之前说过了那个失误,如果失误挂掉了,是不是压根就没动China。如果没到China里边。他算put成功的吗?不算吧,他不会算put成功的对不对,你都没到拆呢,怎么能叫成功的呢?这不算,那如果你的source是在看,那这个数据丢了,而且在这反映不出来的。
08:11
对吧,那如果说我们用的是tell。那是不是反一定相等啊,对吧?啊一定相等的啊是这个意思,是这样东西,所以呢,它能反映到一点东西,对吧?啊是这样的一个情况,嗯,现在呢,我们再去刷新一下,他他应该走了一会我点了是吧,我以为有点了关机啊结束我们再刷新一下,哎,进到这一个图看这个大图了是吧,退出来啊啊刷新一下。是不是跑了一会儿对吧,还是出的尝试的是一次吧。成功的是一次,因为我们只发了一条数据嘛,对吧,啊,只发了一条数据是这个意思,然后size当中现在有东西吗?没有,因为数据已经被什么take成功了,拿走了对吧?啊拿走了啊是这样的一个情况,所以呢,能看上一点东西,正常来说呢,它等于这个China size加上什么take成功的对吧?啊错了吧,应该是他。
09:19
获得成功的对吧,不能拿尝试的去讲尝试的,那你知道他尝试多少次,不好说对吧?啊行,这是我们所聊的这个监控啊,就主要的是更重要的是在面试过程当中,人家可能问你两个问题,第一有没有做监控,对吧,你说有用了,刚领用监控干什么用了。要刚列上什么对干什么事了,对吧,你就把相应的指标,诶,我们上面能看到这些指标,那通过两个指标或者某三个指标放在一起,我们能知道集群是否有问题,或者是否有旧数据,对吧?啊,就类似这样的东西就够了啊。
我来说两句