00:00
好,那现在我们来开始进入这个麒麟的这个学习啊,呃,首先先看一下他这个定义吧,咱们看文档啊。咱把这个定义好好看一下啊,首先第一点阿帕奇麒麟是一个开源的分布式的分析引擎啊,你看它最终定位在什么上面了,分析引擎对吧?分析引擎是不是就计算引擎啊,相当于对不对,那往后看啊。它提供了什么呢?提供了海杜、op Spark之上的circle查询接口啊,这句话怎么理解啊,可能咱们这么理解的话呢,可能大家可能会有一定的偏差啊,好像是什么叫提供Spark、海度和之上的so查询接口,那好像就是什么意思啊,好像就是呢,我这儿呢,给你提供了一个circle的接口,你可以写circle对不对,然后写完circle之后呢,它是不是会转成海度MR或者Spark去运行啊,是不是看到这句话之后,大家很可能会这样去理解呀,对吧?但你这样去理解的话呢,是有偏差的啊,是有偏差的,它不是一个这样的底层,底层不是这样的一个原理,不是说你把词索给他,它立即给你转成MR或此SPA去给你进行这个计算,然后再给你返回,结果不是这样的。
01:11
啊,他不认,那要是这样的话,那那跟have有啥区别,是是没啥区别的呀,对吧?哎,不是这样的啊,所以大家这块呢,要先留留一个神啊,一会儿后续呢,我们再给大家说这个麒麟底层的计算引擎到底是什么什么样的一个逻辑啊啊那但是呢,确实这个SPA这个麒麟呢,它底层会依赖于海deop或者是Spark啊,确实会谚语啊,但是不是大家想的那样啊,大家想那样行,那我们现来接着往下走啊,也就是说这块呢,它底层会用到海deop,会用到巴克,然后呢,给我们提供了一个SQ接口,就我们使用麒麟的话,我们是不是就写S啊啊写S,然后往下走。下边呢,它还提供了一个什么呀,就是叫做多维分析的一个能力。多维分析的能力啊,那后边有一小括号里边有op对吧?Op这个概念呢,咱们之前接触过啊,在讲那个数仓之前啊,最开始的时候,咱们讲概念的时候,是不是讲过op和or TP啊对不对?那当时咱们说了or TP和orp这俩是啥呀?是两种对数据的这个处理方式吧,对不对啊,那orp呢,咱们一般指的是什么呀?啊,不是啊,Orp是分析型系统,就咱们数仓里边的这个数据的处理方式,那or TP是不是才是关型数据库啊,是咱们那种啊加va项目是不是采用的这个数据的处理方式啊,对不对,这俩要搞清楚啊,不要搞混了啊那诶当初我们是这样去理解这个op的,那说什么呀?是一种分析型的这个数据的处理方式,那咱们叫op对不对,那这边呢。
02:43
好像又把它跟谁画成等号了呀,跟多余分析这个概念画成等号了,对吧?啊好,那这个op呢,现在大家可能还是有点模糊,到底什么叫orap啊,哎,不清楚啊,没关系啊,后续我们会重点的详细的把这个orap这个概念呢再给大家讲,哎,重点阐述一下,后续咱们再说啊也是现在呢,我们大致知道麒麟它是一个什么东西了,是一个分析引擎底层啊,会依赖于Spark或者是海杜吧,啊然后呢,我们使用它就是写S啊写然后呢才能干啥,能够进行所谓的多维分析。
03:15
啊哎,这是他,哎他的这个基本的一个认识啊,基本认识啊,然后咱们往后看。那这个麒麟呢,它支持超大规模的数据集啊,超大规模然后呢,能够在亚秒内查询巨大的hi物表啊,超大规模然后呢是亚秒那响应啊亚秒什么叫亚秒啊。亚秒就是比秒还要快啊,零点几秒啊,就亚秒级啊,亚秒级啊,那而且呢,麒麟具备以下这样的特点啊,你说按理来说啊,随着咱们数据量的增长,那你说你的查询延迟会怎么样啊,是不是会随之增长对不对,按理来说是这样的,对吧,但是麒麟呢,它不是这样的啊,你查询的这张表啊,我的数据量大啊,我再大,我的查询延迟呢,始终能维持在一个较低的水平。
04:06
始终能维持在一个交接水平啊,这是呃,很强的一点,很强的一点啊,那他是到底是怎么做到的呢?啊,那我们后续呢,再给大家逐一的解释啊,也是看完他这个介绍之后呢,咱们现在可能内心中可能会有一些这个疑问,对吧?那这句话到底什么意思啊,到底是什么叫做提供,还做过SPA之上的这个SQ查询接口啊,对不对,到底什么是多维分析啊一它为什么能实现超大规模数据集,然后能在亚明内响应,为什么能实现啊,那可能会有一些疑问,那没关系啊,咱们现在呢,就开始逐一的去解答咱们刚才讲的这些疑问啊好,我把视频先录一下啊。
我来说两句