00:00
好,那咱们现在就是一点一点的把这个oap这个概念呢,我们给他引出来啊,咱一点一点引出来,然后呃,视频我先这个PPT我先放映一下啊。我把这个拉下来。大家看,首先第一个概念呢,是这个数据仓库的啊,那咱们这个麒麟呢,实际上是能够跟我们的数仓是做一个非常好的一个整合,一个对接的,是非常强的啊,那数据仓库的概念咱们不用再多说了,这个咱们刚学完对吧?那我们先看看他这块的一个标准的一个定义吧,那数仓呢,它是一个各种数据的,呃,中心存储系统,那各种数据啊,这个各种其实包含的这个范围就比较大了,有什么时间上的,呃,从时间维度上讲,它会有历史数据对不对?呃,以及当前数据,那呃从这个这是纵向啊,时间纵向,那从横向来看呢,横向来看会有什么呀,会有咱们这个,呃企业的,会有咱们这个企业部门的,企业里边啊,就是各个部门的数据,会有咱们企业当中各个部门的数据,诶各个部门都有,那除了咱们本企业的这个数据呢,甚至还可以包含什么呀。
01:08
竞争对手的数据,竞争对手的数据啊,那这就是呃,咱们这个所谓的各种数据啊,这里边儿其实数据来源是很广的很广的啊,当然呃,前面可能大家那个有同学看过一个新闻啊,就是呃,忘记是哪个公司了,就是有一个那个程序员,嗯,写了一个什么呀,写了一个这个写了个爬虫。对吧,就是爬虫干什么用的,我写爬虫是不是就可以去,呃,让他去爬取咱们那个,呃,其他那个网站的数据啊,对吧?诶写了一个爬虫,然后导致什么,导致这个公司,呃,可能是侵权了还是怎么的啊,结果就是整个部门好像都被这个带走了,都被带走了啊是这样的,所以说这个获取竞争对手的数据呢,一定要合法,一定要合法,好这个咱们呃不考虑这个啊,就是我们后期大家自己到公司之后呢,呃,更多你那个书当中数据啊,更多还是分析咱们自己的数据。
02:01
分析自己的数据啊,行,那也就是大家知道咱们数仓是一个各种数据的这个核心部件就可以了,那数仓它到底是服务于什么的呢?其实服务于咱们下边这个的啊,往下看,其实数仓呢,是服务于咱们这个,呃,BI系统的,这其实也有一句话啊,是BI系统的核心部件,那BI指的是什么?呃,是business intellIgEnce,商务职能,或者叫做商业智能也也可以,那商务职能或商业职能它到底是干什么用的呢?其实这个东西可以用一句话给大家总结来看一看,这个商业智能到底是什么?商业智能呢?通常被我们理解为理解为什么呢?将企业中现有的数据转化为知识。然后帮企业做出明智的业务经营决策的一个工具,这是商务职能或者商业职能,诶它的这个基础定义,基本定义,那这个这句话核心是什么呢?核心就在这儿。是不是就是我们需要将企业中现有的数据转化为知识啊?
03:00
对不对?那数据大家都知道是什么,那所谓的知识是什么呢?知识其实就是从数据当中,我们去挖掘这个数据的一些规律,找一些这个数据的一些价值,这其实就是所谓的这个知识啊,所谓知识,那我们要想从数据当中去挖掘它潜在的价值,或去寻找它这个潜在的一些规律,那我们怎么去做呢?我们肯定需要一些技术手段,对不对?那通常有什么技术手段呢?往下看。我们肯定会用到这个数仓,可能会有数仓,那为什么呢?想一想数据,你是不是要从数据当中去挖掘这个价值,那你是不是首先得有一个地方去存储,去管理我们的这个数据啊,对不对,那这个数仓诶其实起到就是这个作用,就是它能够管理咱们这个历史数据,以及存储咱们历史数据,诶包括能够分析咱们这个历史数据,这是咱们最基础的一个部件,也是最核心的一个部件啊BI的核心部件,好,那咱们数据有了后边你还得干什么,你还得去来分析咱们这个数据,那分析数据的时候呢,我们会有啊,会有什么呀?呃,会有很多种这个技术手段,比如说在这儿我们提到的这个联机分析处理,也就是所谓的o lap多维分析,多维分析。
04:11
那后边呢,还会有什么,还会有什么数据挖,数据挖掘,包括后边的什么用画像机学习等等等等这些东西呢,实际上都是我们挖掘数据的这个呃手段,挖掘数据价值的手段,对吧?那当然啊,在这里边我们这个联机分析处理op呢,相对来说还是比较简单的,那后边你对于这个数据挖掘或者是机器学习这些东西啊,就对大家这个这个算这个算法,哎,包括这个数学基础要求相对来说就高一些了。是这样的啊,那这边呢,我们,呃,因为麒麟它是一个什么,麒麟前面不是讲了嘛,它是一个op分析系统,那所以说我们现在呢,来重点来说一下到底什么是o lap,好,我们三页看下边那O它的全是什么,全是这个online,呃,Analyical processing是不是,呃在线什么这个联机联机啊联机,然后这个分析处理对不对,那这是对orp的一个翻译,但其实这个翻译我们直译过来之后,其实跟没有翻译也没啥区别,我们还是不了解,还是不理解OPP到底是啥对吧?那我们来看看这个通俗的定义是什么啊,来看看通俗定义。
05:17
那通俗的定义就是op呢,它是一种软件技术,它能使分析人员,呃,从什么从诶这个迅速的,一致的,交互的从各个方面去观察信息。对不对,首先你看前面这几个词,迅速一致交互,这体现什么?体现是不是就首先就是快呀,对不对,你得是交互式的,什么叫交互式,比如说咱们买SQ的那个命令行客户端,那就是一个交互式的客户端,就是我把SQL给它输进去,立马返回结果,输SQ立马返回结果,那这样我是不是方便我去各种去分析咱们的数据啊,方便各种分析,对所谓的交互式,交互式那op呢,就要求我们得是怎么样得是迅速一致交互的,那然后这个红的是重点,从各个方面观察信息。
06:02
为什么从各个方面去观察呢?因为你只有从各个方面去观察,你才能深入的去理解咱们这个数据对不对,诶,那这是我们这个所谓的OAP,它要提供的功能就是能够从各个方面观察对不对,那从各个方面观察说白了其实就是什么呀,其实就是不从不同的维度去观察咱们这个数据对不对,从不同维度去观察,那因此orp呢,我们也通常叫做多维分析。多维分就是从不同的维度去观察数据,是这样的啊,那现在呢,也就是大家可以这么去理解的啊,就是OAP,那就是多维分析,你可以这么去理解,可以这么理解啊好,那这个到底什么叫做多维分析呢?我或者说我怎么去进行多维分析呢?对不对,那这个我们下边有一个小例子,大家来看一下啊。我这有一个订单,这是一个订单表,当然这个订单表是一个比较简陋的一个订单表啊,我这个随便写的比较简单,那大家先来看一看这个表里边的字段,首先订单有一个自己的ID,这个不用说,下边呢有下单地区,下单品类。
07:03
下来时间。然后呢,有一个订单金额对不对,那这张表里边儿呢。我们的主要字段,我们不考虑订单ID了,我们主要字段有这样的四个,有四个,那前三个是什么?前三个是不是都是咱们这个订单的维度啊,相当于是地区、品类、时间,这是不是都属于维度对不对?那后边这个订单金额属于什么?属于咱们那个事实度量值对不对?诶度量值,那OK,那现在我们要分析数据,大家可以想一想,你说我们去分析数据,我们更多的分析的是谁?其实大家在咱们做那个数仓指标的时候,其实大概也能分析出来,你后边你分析分析各种分析,你分析的都是什么,你分析的其实都是市值表当中那个度量值。对不对,一会儿对它进行sum姆求和,一会儿求什么平均值,一会儿求个这个,呃,这个抗星对不对,你其实分析的都是度量值对不对,然后你从什么角度去分析这个度量值呢?是不是咱们那个所谓的维度啊,所的维度,其实这就是咱们后续做这个收藏分析的,也就是做收藏需求里边就是基本上大致都是这样的一些需求,就是诶分析度量值,然后呢,前面得带着某种维度,某种维度啊,大致就是这样,好,那咱们现在呢,呃,先不考虑那个事了,我们回到这来啊,我们要做什么,我们要做多维分析了。
08:18
要做作业分析了,那现在我的需求是什么呢?看一看,我们需要去从不同角度去观察咱们订单金额总和的规律。分析订单金额总和的规律,需要从哪呢?从不同的角度去观察,因为多维分析嘛,对不对,那怎么去分析,咱们不考虑,我们先问一下大家,我先问一下大家,你说咱们这儿这个所谓的不同的角度。所谓的不同角度,应该一共有几种角度?应该一共有这样的几种角度。几种角度,应该有几种角度?这个可以回答一下这个问题啊,大家可以想一想,咱们这有几种角度。可以可以想一想啊,就是去分析订单金额这个总和它的规律,我们有几种角度,几种角度。
09:06
哎,这个有的同学这个说的很快啊,哎,有三种角度,那你觉得这个问题要是这么简单的话,这个1231个数数这样的问题我会问吗?对不对,那肯定不会问的,肯定没这么简单啊,肯定不是三种。因为是几种啊。应该是几种。总和啊,应该是七种,应该是七种啊,大家来看一下。我们观察这个问题的角度呢,应该是有这样的七种的。那同学可能大部分同学只想到了这样的前三种,就是说哎地区可能跟叉有关系,那品类跟它有关系对不对,那是不是也有可能咱们的地区加上品类跟这个订单金额是有这个某种关系的呀,是不是咱们这也是,诶也也是一个观察问题的角度啊对不对,那包括其他的组合,那包再包括这个什么呀,最后一个诶跟可能跟我所有维度都有关系。
10:05
对不对,那它是不是也是咱们观察这个订单金额规律的一个规,这样的一个一个角度啊,也是一个角度,那所以说呃,咱们这儿的这个,呃,所谓的不同的角度呢,实际上应该是有这样的七种,那这个七种相当于什么呢?对,这个同学说的对啊,你看啊,他说的什么,曹川说的是可以组合,可以组合,确实是啊,其实咱们这儿呢,这个所谓的角度,就是咱们这个所有维度的这个各种组合,全部组合啊,这是全部组合。那咱们这儿呢,是有一个规律的,这个规律是怎么来的啊,这个规律是这样的啊,是二的N次方减一。这个N指的是什么?N指的是维度的个数,咱们这维度个数是三,那这个N就是三二的三次方八八减一等于七。咱们这个是这么去来的啊,这么来的,然后这个公式呢,大家可以记住啊,是二的N次方减一把它记住,然后这公式其实也是可以推的,可以推的啊,可以简单的推一下啊,这个一推的话,你用什么可以用咱们那个,呃,高中或者初中的一个二项式定理,你可以推他一下,那咱们这其实你去算这个所有的维度组合的时候,应该是怎么算呢?是不是应该是CN1。
11:15
然后加上多少,加上CN2对不对,你看这个,这是不是就是一个的,这是俩的,从这个所有维度当中取俩,那下边的是不是从所有维当中取所有的呀,那一直加加加加加多少加到CNN对不对?那这个东西它等于多少呢?这个东西就等于二的N次方减一,它等于它,那怎么来的啊,简单的说一下吧,可以这么推啊,那二项式定大大二项式,二项式定理大家应该还都记得吧。A加B的N次方对不对,等于什么,等于这个CN,哎,零,A的N次,哎,再乘以B的呃N次N,呃,B的零次,然后加什么CN1对吧,然后什么什么什么咱不管,那这时候你直接怎么样,直接把这个A和B都替换成一,那就变成一加一的N次方,诶也是二的N次方呗,对不对,它是不是就等于什么CN0加CN1加C2一直加到CNN啊,那CN0我们这是没有意义的,所以说你是不是需要把它减掉,CN0等于几?CN0等于一,那剩下的那一大串,也就是这一大串是不是就等于二的N次方减一了呀。
12:18
哎,其实这个可以是推出来的啊,那这个东西呃,咱们就是呃做一个扩展吧,你知道他怎么来的就行,把这个公式记住就行了,二的N次方减一,好,那这就是咱们这个观察这个问题的角度,咱们列出来了,那列出来之后呢,在这儿大家呃需要呃需要理解到两个层次,两个层一是什么呢?一是诶我们观察问题的角度是怎么去算的,这个是二的N次方减一,诶这个大家都知道了,那还有一个点呢,大家要意识到,意识到什么,我们这个观察问题的角度啊,咱是可以怎么出来的,是可以穷举出来的。大家把这个先想明白啊,咱们是不是可以穷举出来的,就是说我甭管我有几个维度,甭管有几个,只要你告诉我有几个,我是不是肯定都能把这个所有的维度穷举出来,什么叫穷举?所有穷举就是哎,一个一个的全部都给你列出来。
13:09
是不是啊,诶,咱们这应该能够理解到这样的一个层次啊,就是我能够穷举出来所有的维度组合好,把这个点先记住,行,那咱们现在接下来我们的问题来了,就是说你已经知道了,诶你呃有这么多的角度去观察数据了,那现在问题就是如何去从这些角度去分析数据。怎么从这些角度去观察这个所谓的订单金额总和,怎么去观察?怎么去观察?最容易最容易这种方式不就写SQ就行,对不对,那比如说我现在想去观察一下这个地区品类,这个维这个角度对不对?哎,我想观键,呃,观察一下这个角度和订单金额总合的规律,那你怎么写S会就行,怎么写select,然后什么东西地区品类,然后还有什么,还有some订单金额吧,诶把这个选选完之后from这张表,然后接下来个什么,你叫BY啊BY,然后地区加品类。
14:09
是不是就行了,那你是不是又得到了地区品类和订单金额总和之间那样一个关系啊,对不对,你就得到了这样一个关系了,那这个呢,其实就是,呃,咱们这个最简单一种这个多维分析的方式,就是怎么样格BY,然后加聚合函数对不对,你是不是就能够得到咱们这个要分析的字段和你这个维度之间的关系啊,那个规律你是不是就找到了,找到这个规律之后呢,你其实就可以做。各种业务决策对不对?那这就是咱们最简单一的方式,进行多维分析的方式,好了,那咱们往下看,我现在说了一种什么呢?诶,这是一种方式,对不对?一种方式,那有一种方式是不是还还会有第二种方式啊,对不对?那接下来咱们看o lap还有哪些方式啊,我们op呢,大致可以分为这样的两类,一种叫做RO lap,呃,全称是relational olap或者o lap,这个东西就是大家出去之后呢,呃,很有可能人家会说什么olap。
15:04
O lap就是指的就是o lap,但其实叫oo lap呢,那那就是说呃,就是这么读吧,就这么读吧,但其实它应该是几个呃单词的首字母orp啊好,那这个一个是relation。Re,什么意思,是不是关系型的呀?对吧?那还有一种叫做什么叫做mop,全称是呃,Multi dimensional o multi dimensional什么意思,是不是多维的呀,多维的那这俩它有什么区别,有什么联系呢?我们来往下看啊。首先RO lap,它是基于这个关系型数据库的。什么叫做RO ABB关系型,关系型那它的特点应该是什么特点,就是说我查询的时候是不是就是写circle考,嗯,是不是写circle考对不对,那因为你是基于关型数据库的嘛,那你数据呢,存在这个类似于关型数据库的这样的一个架构当中,那我写SQ的时候呢,我我分析的时候呢,我就用SQ去分析,因为你是关型的嘛,那这样的这个o op呢,我是不需要进行预算的,因为我的明细数据,原始数据我就存在这个,诶咱们关系数据库类似于关于数据库的这种表当中啊,你就存在里边就行,所里边我就写S,我该聚合就聚合,我该分析就分析,对不对,你是不需要进行预计算的。
16:17
这是咱们lap它的这个特点,那后边我们还有一种叫做Mo lap,它的特点是什么呢?它是基于多维数据集的。基于多维数据集,那这个概念呢,可能大家比较这个陌生,并不知道什么叫多维数据集,对吧?那这个一会儿我们会详细去说这个多维数据集的,一会再说,那下边我们看看它有什么特点,它的特点呢是需要进行预计算。这是它特点啊,那这个东西但现在可能也理解不了,为什么他就需要预计算了,也理不了,那等我们讲完多元数据集之后呢,你就知道他为什么要进行计算了,OK,那现在呢,我们需要去讲一下这个多维数据集,咱们为什么要讲它呢?是因为咱们的麒麟K。
17:02
它就是一个Mo lap分析引擎。它就是一个MMRP分析引擎啊好了,那这个大家先先知道这个麒麟的这个定位啊,好完了之后呢,我们往下看,下边呢,我们诶我们不是要讲那个什么多维数据集吗?对不对,那怎么又出来了一个olp cub呢?呃,是这样的啊,你看这句话。Lap基于多维数据集,那一个多维数据集呢,我们通常称之为一个o lapq吧,那也就是说,呃,这个概念是不是就是诶多维数据集啊,对不对,那我们来看看什么叫做OLAPq吧,讲OPq吧之前先来分析一下这个这个单词什么意思吧。这个单元什么意思,这单词是不是就是立方体的意思啊?Q吧,立方体,诶这样的东西。对不对,立方体,好,那接下来我给大家展示一下什么叫做OLAPq吧,大家来看好我这边呢,还是刚才咱们那个所谓的一个订单表,对不对,那现在呃,我画了一个跟它对应的一个OLAPq吧,你看一看。
18:06
我这儿呢,画了一个这样的东西。诶,这个东西来大家看看这个东西能不能看懂啊,能不能看懂,我这呢画了一个什么,画了一个这个三维的一个坐标系,对不对,三维坐标系,那这里边呢,有地区诶有诶品类,有时间,那这三个坐标是不是就正好对应于咱们这个表里边的三个维度啊地区,品类,时间对不对,那这就是一个Q吧,一个立方体,那我现在大家看这个东西应该能看懂对不对,应该能看懂,那我现在我问一个小问题啊,问个小问题,看看大家有没有真正的去看懂这个小方块。我问大家一下这个这个问题吧,大家说一下啊,你说我这里边的一个小方块,就这的这一个小方块啊,你说它代表的是咱们左边这个表里边儿的一行数据还是多行数据。嗯,再问一下啊,这一个小方块儿代表的是咱们左边这个表里边的一行数据还是多行数据。
19:00
如果说是一行的一行的,那就扣一个一,呃,两行这个多行的就扣一个二,回答一下这个问题啊。对,这个陈鹤飞同学说的对啊。哎,有说不对的,有不对的。只有这个,只有这个贺飞核对了啊,行了行了,呃,想要扣一的同学就不要再扣了啊,你们说的是不对的,这一个小块呢,它指代的是多行数据。指的是多行数据啊,那是为什么呢?我们来看一看啊,咱这个小块怎么对应上的,你看啊,这个小块它对应的是什么,它对应的是东北地区。居家品类,哎,二月份儿了。什么东西是不是所有的订单。对不对,居家品类这个东北地区二月份的是不是所有的订单应该都是在这个小方块当中啊,那也就是说这个小方罐其实实际上是一个聚合制,对不对,他把这个表当中,这个东北地区居押品类二月份的所有订单全部汇聚到这个小方块里边来了。
20:03
那也就是说咱们把这个表里边的数据我存到这个多维数据集,也就这个cube当中的时候,要干什么,是不是要进行计算啊,对不对,也就说你这个过程实际上就是哪个,就是咱们那个预计算的过程,实际上就是一个所谓的预计算,那现在大家就知道为什么rap需要进行计算了吧吧,因为你数据往cub里存的时候,你就得它就已经是一个聚合值了,那既然有了聚合值,那我后期我再去进行分析的时候,我我我在比如说我还是想拿到什么呀,比如说这个什么,呃,前面维度组合列出来的拿一个聚合值,那OK,你这个数据还用从头去计算吗?不用了,直接从Q当中去拿拿结果就行了。对不对,那这个就是所谓的OLAPq吧,然后咱们上边有有同学我看问了一个问题啊,你看啊,那要是四个维度咋办,那四个维度咋办,那你要是四个维度的话,那这个图我是肯定是画不出来了。我我反正我是只能画到三维啊,我不知道那个同学能不能画出来四维的东西,只能画到三维,但实际上呢,你把那个空间这个想象能力给他发挥一下啊,就是说诶没有,就是咱虽然画不出来四维,但是有没有这个四维的东西呢,也是有这个四维的啊,甚至五维,六维,七维,八维,九维,十维都是有的。
21:18
对不对,那也是,只只不过我这画不出来,我这画不出来啊,但是应该是,但是也是有这个这个多维的,大家把这个自己去想象一下啊,这个只能靠想象了,我是画是真画不出来。脑子不够使,不够使,那那也没办法了啊来,那接下来呢,咱们继续往下看啊,继续往下看,那也就是咱们现在已经给大家把这个cube的概念已经抛出去了啊,已经抛出去了,那也就是咱们数据往cube里存,要进行预算预算啊,然后咱们接下来往下看,那实际上啊,给大家说一下,给大家说什么呢?大家来说一下啊,就是咱们我画的这个东西。我画的这个东西啊,你说它能够分析咱们这个问题的角度,有有是哪个是哪个,咱们前面讲了,我们分析它,分析它啊,诶咱们这个角度一共有几个,咱们角度一共有这样的七个,对不对?那你说我用这个小方块儿,我用它能分析几个角度。
22:14
这个东西,诶,这个答案出来了啊,答案出来了,也就这个东西,你能分析几个角度。这个东西啊,其实你只能分析一个角度。只能分析一个角度啊,就是诶按照什么呀,只能是这个角度。对不对,你你从这里边儿,你只能拿到诶这个地区品类时间,诶然后呢,和谁和咱们订单金额总和的规律,对不对,那我要想拿地区品类跟订单金额的关系,你从这里边直能直接拿吗?你拿不到。拿不到,你不是最终的结果对不对,那所以说我们其他的角度是不是也应该有一个跟它对应的这样的一个方块啊,对不对,那比如说咱们往后看。比如说后边我这呢,有这个就是两个维度的,比如说有地区,有品类地区时间,品类时间,那它对应的那个Q是不是应该是这样的,是不是应该是二维的呀,就二维的对不对,那这个二维的你其实可以想一下它怎么可以怎么来,可以怎么来。
23:07
是不是从这儿到这儿可以来一下啊,怎么来,因为这里边咱们只有品类和地区的,我没有没有时间了,没有时间相当于怎么样,是不是把这个时间维度给他干什么呢?给它降掉了,降为了,然后咱们要做的事是什么呢?咱们从计算上去考虑啊,可以可以扩展一下,咱们从计算上考虑,这边可以怎么算,是不是就是以它为这个原始数据,然后对这个时间进行聚合。对不对,那你就得到了这个东西了,就得到这个东西了,能理解吧,就是我们可以进行降维压扁,对没错啊,那OK,那它完之后呢,再往下看,下边有谁,下边呢,有咱们这个。角度五,那角度五呢,诶同理它也有一个对应的二维的Q吧,也有一个对应的啊,那这个呢,诶同理也有一个对应的,我这儿呢,没有全画出来,但是大家要知道,我其实上是一个角度对应一个这样的一个方块,一个角度对应一个方块啊好,那同理我们后边呢,还有一个维度的,还有一个维度的。
24:03
这个地方好,那一个维度怎么来呢?是不是可以从二维压扁而来啊,诶就是降维而来,那也是需要画三个,我只画了一个而已,只画了一个而已啊好了,那到现在为止,那咱们七个角度,我是不是每个角度都有一个自己的这样的一个Q呗,对不对,那这样一来,我不管从什么角度去观察这个数据,那我是不是都能直接拿结果了,这次都能直接拿结果了啊好,那这个就是咱们这个o lap这个cub的一个概念啊好了,那现在呢,我们,呃讲完这个概念之后呢,我需要给大家纠正一个概念,需要纠正一个概念啊,刚才咱们前面这么讲的,我们说什么呀,说这个是不是就是一个o lap q啊,那说这个也是一个Q吧,但其实这么说诶是不准确的。是不是准确的啊,我们来看一下这俩概念,一个概念叫做Q吧。这是什么?这是立方体的意思,刚才咱们说过了啊,虽说立方体我们大家都知道是三维才叫立方体,对不对,但其实这个并不是三维,几维甭稳的,几维几维它都叫这个东西啊,都叫Q吧,那后边还有一个qbo的。
25:07
QY的什么意思呢?QY的意思是长方体的意思。是长方体的意思啊,长方体,那这个cube跟qbo他们之间的关系怎么样,是什么样的呢?是这样的啊,就是我们每一个角度,每一个角度对应的这个方块呢,实际上是叫做一个qbo。实际上是叫做一个qbo啊,那这是一个qbo,那这个呢也是一个qbo,那这个也是一个Bo,那什么是一个CU呢?诶这个所有的维度组合。所有的维度组合组合在一起,我们组成的这个数据集呢,才叫做一个Q吧。是这样的,也是所有维度组合加在一起叫做一个Q吧,然后每个角度呢,就是每一个维度组合呢,叫一个qbo,这不是QID啊,你看清楚啊,不是QID是q boy,好,这是咱们这个,诶标准的这个定义啊,标准定义所有维度组合叫做一个Q吧,每个维度组合叫做一个q boy,好,那这俩概念咱们就这个完事了啊,就完事了,行,那看一下这个同学的问题啊。
26:14
这个计算量,呃不得大的不得了,哎,确实是这样的,这个子阳同学说的对,那我们这种预计算的方式呢,确实会这个,呃干什么呀,确实会那个有比较大的这个计算量,那其次呢,还会有什么,还会占量比较大的存储空间,存储空间,但是这这些都是什么,都是予以计算,对不对,是咱们提前算好,那后续我查的时候呢,我就我就怎么我就快了,就实际上相当于有一个什么呀,相当于有一个以空间换时间的这样一个思想。对不对,咱们所以说我最最终计算完这个结果会占用大量的存储空间,但是我最终干什么呀,我最终查的时候我快呀,对不对,以空间换时间,有一个这样一个思想啊好,这是咱们这种呃予以计算的这个基本的原理,Mop就是这样啊好了,那这个cub的概念,咱们说完之后,那我们去使用麒麟的时候呢,那我们就容易很多了,好,那往下看。
27:09
下边我们还有一些这个基础的概念,在麒麟当中也会涉及得到,因为咱们麒麟啊,它是能够对接咱们这个数据仓库的,我们说的当中,我们常是进行维度建模,维度建模当中我们有两类表,一类表叫实时表,一类表叫维度表,对不对?那他们之间的模型也有什么呀?有有星型模型,有雪花模型对不对?那咱们麒麟呢,我们去对接数仓的时候呢,它是能够直接去对接咱们的星型模型或者是雪花模型的。这是非常不错的啊,非常不错的直接对接,也就是说我们使用麒麟可以让他去对接咱们的DWD层吧,可以对接DWD层啊好,那星星模型的概念呢,这个我不用再说了,大家应该都比较清楚,有中间是实时表,周围是维度表,这个不再说了啊好,咱们往下看,下边呢有两个概念,这个概念呢,是咱们o lap当中的两个概念,实际上也能跟我们的这个什么呀,也能跟咱们的,呃呃,维度建模也能很好的这个建立联系。
28:08
那这俩概念的一个叫做维度,一个叫做度量,那实际上这个维度就相当于我们这个,呃,维度模型当中维度表里边字段对不对,那这个度量是什么呢?度量就相当于咱们维度模型当中事实表的那个事实跟那个度量值对不对?哎,是这样的分,能够跟我们的维度模型进行很好很好的一个联系啊,那实际上这俩概念呢,是我们o lap多维分析当中的概念。多维分析当中的概念啊,那维度是什么?就是咱们去看问题的这个,呃,这个维度,这个角度对不对?那度量是什么呢?度量就是你要分析的那个,诶度量字段是这样的啊,那也就是说我们去干什么呀,我们去使用麒麟,让他去对接咱们have的星星模型或雪花模型的时候,你需要指明哪个是你的维度,哪个是你的事实,然后后后续呢,我们麒麟就能够按照我们这个预计算的规则,帮你把所有可能会有的这个维度组合全部给你计算出来,那后期你再算的时候呢,你再查的时候呢,那直接拿结果就可以了。
29:10
诶,这是咱们麒麟的一个基础的这个,呃,原理啊,基本的原理好,那这是维度,这是度量好了,那这个基础的这个一些概念呢,我们就分析完了啊,主要是给大家讲了一下咱们的这个o lap op啊,那IP就是多维分析,多维分析呢,我分这样的两类,关型数据库的,基于关系数据库的,还有一个基于作为作为数据集的,那麒麟是谁,麒麟它是不是就是一个mop啊,诶基于作为数据集的,那它的原理是什么呢?原理是这种ola cub对吧,那cube是什么,什么意思,然后怎么来,应该大家都清楚了。那这边咱们就完事了啊,视频我录一下。
我来说两句