00:00
好,接下来我们看几个大家都用淡了的函数是吧,用了函数看一下什么总行数,最大值,最小值,总值和平均值,一个一个来做一下吧,行数select的。Count星from这张表,那这个肯定要走map吧啊,那我之前就提醒过的这种map这个就比较好做啊。统计多少行啊。这个就用到了一个reduce去统计是吧,哪一行数据就加一,哪一行数据加一,最终是一个14行,14行那大家要需要了解的一个问题就是,呃,你们有没有自己了解过count新COUNT1和count一个列的区别?
01:01
就这三个东西看1COUNT星,还有一个Co count一个链这种啊,这三个的区别。三个的区别有什么区别,这块不知道的下去自己查一查啊,自己了解了解,因为这块在面试当中是有分的,你你不要想着have呢。他只会问跟have有关的东西,这确实是MYSO当中的问题。他也会问很多关于MYSO当中的问题,就MYSO当中的行转列,列转行的问题。好。然后对,有同学提到,这就是他之间各个函数之间有效率不同的问题,那什么时候效率相同,什么时候又不同了呢?
02:05
啊,你要你要知道还有的这里面哪个不会计算那的字段。对吧,这个都是需要去了解的,需要去了解的。这是我们求的一个count count,然后还有什么max me是吧?来,都来做一下select。Max薪水吧,然后EP这张表走一下。那最大值这种写M热度怎么写?他不办。你们最后一个还给自己都抄了吗?求top那个案例有有的没敲是吧,还是敲一下那个top,他在面试当中问的也挺多的,也挺多的。
03:11
这个最大值5000嘛,哎,然后再看一下那一个最小值,就基本的我们都测一下,它都是像这种东西都会走具体的一个ma任务去分析吧,去分析的。因为他直接看这些数据啊,是拿不到的,它的一个分析引擎就是MEMORY6,它只要涉及到一些计算,或者说最大值最小值啊,或者说求平均值啊等等这些东西,它都需要走这个M6次程序啊,这是最小值,然后还有一个什么平均值吧,平均值AV置,就这些函数啊,基本的这些函数啊,就跟MYSO都是类似的,都是类似的,但是它里边这个函数比MY当中要多的多,要多很多。而且像这些东西。
04:00
嗯,其实过程当中开发也挺常用的啊,这这些函数啊,求总值,或者说求什么类型的平均值这种东西,当然它一般都不是对于整表整张表来求的,而是它先定的一个范围,先定一个某一个范围来求的,它这个平均值这么大,平均值这么大。嗯,还有一个求和是吧,求和。他这些函数买这个里边基本的函数,然后在还里也都是有的。如果是买so的话,你像这几条语句早都执行完了是吧,随便执行一条的时间都不,他执行完了是吧,但是你像have里边就不行,所以说你have一般没有谁拿API调用这种东西去呈现给前台吧,那太慢了,你看咱们的数据量才十几条吧,他14条是吧,当时看到统计的14条的一个数据,统计完了多长时间,21秒,21秒太慢了是吧,因为它启动的一个时间就很慢,它真正计算的一个时间啊,其实很短,其实很短了,这是我们所讲的它的一个常用的啊,而且是基本的一个函数啊,后面我们肯定还有一些高级的函数啊,高级的函数也是很常用的,做分析是肯定会用到的。
05:25
肯定会用到的。
我来说两句