00:00
好,那我们现在要学的是麒麟的使用,那大家说我们麒麟使用,咱们主要学什么东西。主要学啥呀?其实两方面呗,第一个呢,就是关于这个预计算,那一个就是关于查询对不对啊,因为大家都知道麒麟我们是基于预计算的。然后他一计算呢,他会怎么做呀。他会给你把这个是不是把这个所有的这个结果全部给你穷举出来。对不对,所有的可能性全部给你选举出来。那所以说,那咱们要想让麒麟去给你雄举,结果我们得怎么样啊,我们是不是得告诉麒麟告诉他啥。你就告诉他啥呀,告诉他你的维度字段是谁,你的度量值是谁,对不对,那还得告诉他啥,还得告诉他你那个聚合函数应该是啥,对吧?因为你要聚合的话,是不是肯定得有一个聚合函数啊,你求平均值函数求和还是求最大值,是不是得告诉他对不对,那也就是说我们需要给它定义好这个预计算的规则,那当然其实说白了就是告诉他你的维度有谁,度量值有谁,聚合函数是什么,是不是把这些信息告诉他,那他就能够给你进行结果的穷举了呀,对不对,其实咱们学习使用啊,呃,学习这个麒麟使用我们这个计算方面呢,就主要就是学习这个,就是如何去给麒麟配置这个计算规则。
01:19
啊,具体的计算规则就是维度是谁,度量值是谁啊,聚合函数是什么啊,那这是一方面,那还有一方面就是啥,就是学习如何去使用其连查询数据对不对啊,啊怎么去查询,那这就咱们两方面呗,啊查询就是写circleq呗,Circleq大家都会写,但是你得知道你往哪写对吧,你怎么把你的circleq发给麒麟,这时候咱们得学一下啊,对吧,这是我们呃要学的两方面啊,那咱们现在肯定是先学谁计算呗,先计算啊好,那要学计算的话,我们要做第一件事呢,是不是得先对接上我们的数据源才行,对不对,怎么对接数据源呀。哎,这是不是有一个data source啊,看到没有啊,但是呢,你在对接数据源之前,一定得确保一个事什么事啊,这告诉你了。
02:04
是不是有一个什么no project selected呀啊,什么please select your,有your project first,什么叫project,那这是不是一个项目啊,对吧?那这是不是有一个choose project呀,对吧?他说让我们先选一个,但咱们现在有吗?没有您点点不了,那没有的话是不是得先创建一个呀?那点谁点加号啊,点好ADD product随便取一个,咱们就叫积帽啊积。啊,上面是名字,下面是描述啊,我们点击的提交,点击OK,那就创建成功了,那完之后接下来你看这个位置是不是自动它就给你选中了帽了呀,对不对,因为只有这一个嘛,然后大家后续得注意啊,假如我今天我麒麟装完了,然后我没用,我把它关了,下次再启用的时候呢,这个地方它可能就不会给你自动选择机贸了,那你得保证怎么怎么样啊,自己选一下啊,也就是这样呢,你必须得选中某个机贸,某个那个project,你才能这个正常使用啊这个记住好,那咱有pro是不是就可以对接数据源了,那点这个source那就过来了,过来之后呢,我们这有四个按钮,前两个按钮是对接离线数据的,后两个按钮呢是对接实时数据,能理解吧,那我们现在对接离线,那对接离线的话俩按钮,一个叫load load table,一个叫做load table from tree,那这俩有啥区别呀。
03:21
先点第一个,第一个呢,那你load table的时候呢,在这相当于写啥。表名手写啊,手写用什么风格?With com是啥呀?号啊,像这这种这种这种这个比较常用的这种小单词啊,啊咱们稍微记一记啊对吧,啊call嘛,就是逗号嘛,啊就逗号啊好那接下来呢,我们呃,再这个接着走啊,那也是这你用逗号分隔,那问一下啊,你说这对接表对接是哪的表。对接哪的表。是不是害的表啊?对不对,对接的是have的表啊,对have表它它怎么找到have的表啊,我们是不是配了have home了呀,它是不是能够根据have home找到have的各种配置文件,它是不是能够找到它的原数据啊,是这样的啊,这个大家得得知道啊,他这你直接写对接的就是have的表了啊,比如我现在想对接咱们机贸数据库里边的表,你得怎么写呀啊。
04:16
是不是得记冒点啊啊点比如说DWD什么的log对不对,你得带着库名才行啊,你不带库名的话,它是不是。默认default库啊,啊,这个注意就行了,然后多张表呢,是以逗号分格的啊,那当然这种方式太麻烦了,不用这种,咱们用哪种呢?第二种load him from tree对吧,这是一个可视化的啊,相当于连带是不是有一个这个一个一个数的一个结构啊对吧?这是咱们有default库啊,有什么呀,有集O库,有探索库,那我们找谁集好,那这里边是不是所有的表都出来了呀?那当然下边,呃,我们这儿可以搜索有filter啊,你比如说我现在搜一个DWD,诶你会发现没有对不对,为啥没有啊。因为他搜的是当前页面的啊,当前页面这是不是只有ods,我们需要点谁收帽或者是收二,把所有的都展示出来啊,都展示出来,然后呢,这时候咱们再搜,那我们现在搜的话,我们对接哪儿呢?对接哪一层的呢?
05:10
前面说了麒麟对接的是不是星型或雪花模型啊,对吧,那咱们现在这个DWD层是不是进行了维度建模,所以在这儿呢,我们对接的就是哎DWD,那你就搜DWD啊好DWDDWD完了之后,咱们在这里边去挑一下啊,咱们挑一个哎业务线啊,注意啊,我们现在使用麒麟,你是不是会给他进行这个cub的构建呀,对吧。那QB构建的时候呢,我们有一个这样的对应关系,大家得搞清楚一个Q吧,对应一个星形或雪花模型。啊,那一个星型或球模型里边是不是有一张实时表,多个维度表啊,对不对,然后一个实时表对应一个什么。对应一个咱们业务系统当中的一个业务线吧,对不对,一个加单时表是不是对应下单业务,支付值表对应支付业务对不对,所以整个对应关系大家得搞清楚啊,你使用麒麟对后应该是什么呀?是不是一个Q吧,对应一个业务。
06:08
对不对,下单业务一个Q吧,支付业务一个Q吧,能理解吧,这个大家要搞清楚啊,对应关系我们得对应上啊,啊那比如现在我们想分析下单业务,那下单业务是不是得下单时时表啊,那下单时表咱们找谁啊?咱们俩咱们现在找一个这个呃,最明细的那个吧,找最明细那个啊咱们找谁找到DWD我们得过滤一下啊DWD啊先找事实啊,就直接直接过滤吧DWD然后呢,找一下啊,找到实值表FA的OD是不是它啊没问题吧,那找到它之后呢,我们再接着找。再找,再找,再找维度表,维度表咱们找谁找跟它相关的维度应该是谁。第一个比如说我想分析它跟用户相关的啊,用户相关的找谁找DWD是不是user啊,找下user啊,User在哪了啊不好找啊U在哪呢?DU下边呢是吧,是不是找他那还还还有这个能向关。
07:04
那商品商品找SKU啊,是不是有它,那还有还有地区,那咱把地区也拿过来,这这是你想分析跟谁的关系,你就找谁就行了呀,对不对,那现在我想还想分析跟谁呀,跟这个地区,跟地区找地区呗,被pro是不是没问题,那假如我就想分析跟他们几个的关系,那我们就选这几个表,你看你点它一下是不是就变粗了呀,对吧,变粗就是选中,选中完之后呢,我们往下往右往右看啊,这是不是有一个S同步啊,咱们点击S点。好,那这时候大家看一下啊,咱们这说什么success啊啊success之后之后呢,你看这边是不是有一个机贸这样的一个东西啊,你点开这里边是不是就出现了,我们刚才导过来那些表啊,注意这些表指示什么过来了。只是原数据咱们获取到了数据现在在哪?数据是不是还在HTS上还没动呢,啊,只是原数据拿回来了,好,那表咱们有了,有了之后咱接下来干啥呀。就是不是就得去配置那个所谓的计算规则了呀,对吧,那首先我们要做的第一件事就是你需要先告诉齐麟啊,你这些表哪个是事实,哪个是维度,那你还得告诉他什么呀。
08:11
还得告诉啥,还得告诉你的事实表跟维度表之间啊,是通过哪个字段join的。这个麒麟是不是现在不知道啊,我们得告诉他啊,来,那怎么告诉他呢,点击左边这个model。点完了之后,这是不是有一个绿色的new啊,对吧,那点new.new完之后呢,有三个按钮,先看第一个new model。矛盾就是模型对不对,你看这个图标是啥五角星,那其实它这所哎指的就是啥星型模型啊,其实雪花模型它也支持啊,好,那现在呢,我们相当于需要通过这个model是去指明咱们事实表跟维度表之间的关系,对吧?好,那咱们来点击你用model这边呢,咱们需要起一个名字啊,名字随便起,比如说我就叫做older。Detail,然后呢,叫做呃,这个star吧。那这是不是那个订单明细的一个新型模型啊,对吧,那OK,咱们点击next。
09:06
好,那这时候我们需要先选择fact table是不是实时表,你看是不是能够非常好的跟我们的维度模型进行对接呀,对不对?实表点点选谁谁是师表,Fact order detail没错吧,大家下边呢,有一个lookup table在这块,这个lookup这指的就是啥?就是维度表啊,Lookup是啥意思啊?单词是查找查询的意思对不对,那我们是不是正常怎么去使用维度表,是不是就是从事实表当中拿到维度外键去找维度表里面的数据啊,所以它也叫查找表,所以说也没错啊,点完了之后呢,你你看啊,这是在干什么呀。是在找事实表跟你的维度表完了之后呢,还得有啥,是不是还得有join condition,找condition是不是就是join的连接条件,对吧?其实就在指明你的事实表跟维度表之间的关系,好,那现在from table,咱们现在只能选谁,只能选事实对吧?那是不是事实draw下边的维度啊,那draw方式呢,有inner,有left draw,那在这边呢,我们可以选,比如说选inner draw啊,那往下边走找lookup table。
10:07
Lookup table呢?咱们找谁呀?维度表呗,那先找第一个维度dwdd user完了之后呢,这是不是得写一个连接条件呀,对不对?那咱们连接应该是啥?应该是事实表当中的user ID等于。U维度表当中的ID没错吧,点击OK啊,就这么加,这是不是一张维度表就已经照上了呀?那一个实表是不是跟多个维度表有关系?那接着招唤呗,啊,你看啊,这回再点from table啊,你看。是不是能选俩,一个是事实,一个是维度,是不是都能选,那说明这告诉我们一个什么信息。是不是维度也能照其他表,也就是我这儿是不是支持雪花模型啊。对不对,维度表也能照到,维度表是不是就是雪花模型啊,这个记住就行了啊,那当然咱们这是是这个星型,星型我们就还选实时表,那inner照往下走选第二张维度base province,那点击new condition,这是不是就得找province ID这边就得找ID,点击OK,好,这张表也照上了,那接下来再继续走好,那第一个表示这个实时表,那往下走最后一个维度,那点击new condition,那往下走找SQID找ID,这是不是照上了,点击OK好了,是不是事实跟维度我们都选好了,这样关系也告诉也告诉他了,对吧?那接下来点击下一步。
11:25
下一步你看那我们选啥啊,是不是在我们给这个字段进行分类啊,是不是找维度字段dimensions还得找啥呀,一会儿measures度量值吧,啊,那你看啊,选维度字段的时候,我们是不是可以来自于实时表,也可以来自于维度表,你看它这块是不是正好跟咱们前面讲的那个维度退化的概念对应上了呀,对不对?那你就选呗,看看实值表当中有没有维度字段,有没有看这里边有没有啊。这里边咱们有没有,好像这里边还真没有纬度字段吧,全是ID对吧?那没有的话,那咱们就不选了呗,那没有就不选对吧?那就来选下面这个纬度表当中的纬度字段,这是user对吧?User里边谁可以作为维度字段呢?比如说我们的真真的是不是可以用来分析咱们不同性别之间的这个,哎,各种比例啊,对吧?那就来下边其他的,哎,User level用户级别,那其他的没有咱们就不加了啊,加下边啊,这里边还有啥呀。
12:18
Base province是不是地区,那地区我们一个是省份,一个是没错吧,那接着往下走,下边是商品,那商品的话呢,这里边维度字段可就多了,那比如说第一个谁。PU我们是不是可以作为一个维度啊,PU咱们不找ID的,咱们找谁啊,找name SP name这是不是可以,那品牌是不是可以,那123级分类是不是也是可以的,对不对,那这些都可以作为我的维度啊,我就先分类啊,啊大家要注意啊,咱们现在只是在给这个字段进行分类。这块呢,还没有涉及到啊,没有涉及到什么,没有涉及到后续我们这个计算的,那计算的时候到底用哪些维度,我们一会儿还得再重新指明,能理解吧,现在只是在进行分类,把这个记住啊,这都是维度字段,然后点击下一步,下一步该选谁了。
13:04
Measure度量值,你看度量值只能从哪选事实表啊,你看啊,咱们选度量值,那我们这张表中度量值可就比较多了啊,一个是SKU的number是不是个数啊,还有谁可以作为度量值?这是不是都可以作为度量值,哎,一个是原价最终金额,这是运费,这是优惠金额,是不是都是可以作为度量值的呀,那接下来咱们点击下一步。啊,那到这一步呢,我们相当于完成了这个,哎,字段的划分,那最后一步有一个setting setting是啥呀,是设置啊,那设置这块设置什么,你看啊,一个是partition盆是不是分区,那分区的时候你看这里边让咱选啥select partition table选那个分区表对吧?分表咱们只能选谁。注意只能选十表啊来点完之后呢,咱们往下拉选择你的分区字段吧,那咱分区段是谁?第七字段吧,对不对啊第一资段你的日期格式是啥呀。是不是咱们日期格式可以有不同形式,咱们可以是有横杠,有也可能没有横杠,对吧,咱们是什么年月日,而且分区就按天分区的对吧?这也支持什么按小时按秒啊,这是分钟啊,这是啥呀,按秒啊,那当然咱们这是按天,就是YY杠杠,呃,YYY杠,MM-CD是不是正好跟咱们一样啊,你选这个就行了啊啊那也就是咱们现在是不是指明了,注意指明了事实表的分区字段对不对,那后续咱们去分析统计的时候啊,我们麒麟本身咱们现在对接的have,你做的是什么计算呀,是离线计算吗?
14:36
是离线计算没错吧,那既然离线计算是不是也得是按天计算呀,对不对,那所以说咱们现在有了分期自算了,那我是不是就可以诶,比如说我计算今天的订单,计算前天的订单,今天大前天的订单,是不是一天一天算就可以了呀,是不是根据这个字段就能够识别你的这个天了呀,对吧,是这样的啊,那所以这个字段咱们指定好了,但是你这要注意一下。注意什么事呢?你这儿所选的字段仅仅是啥?
15:03
分区算仅是哪张表呢?仅仅是事实表的分区算,至于维度表的分区,咱们选了吗?是不是没选没选啊,现在一直都没选啊,一直都没选啊好把这点先记住啊,后续我们可能会涉及到这个问题啊好,那这个时表咱们选完了,完了之后呢,下边还有一个地方可以写V过滤条件,大家注意啊,这个V过滤过滤的也是谁呢?也是事实表,跟维度也没关系啊,当然咱们这儿不需要加过滤条件,那就不加了,我们这儿呢,点击C保存yes。好,那现在是不是已经完成了这个所谓的model的创建了呀,Model创建完之后,我们相当于告诉了麒麟谁是事实表,谁是维度表,然后事实维度怎么照呢,也告诉他了,然后再一个呢,已经告诉他谁是维度字段,谁是度量字段,是不是都告诉他了呀?那接下来我们就要定制咱们那个计算规则了,那接下来要做的事呢,就是你得告诉他,你到底计算的维度有几个对不对,你聚合值到底算几个,那你聚合函数到底是什么?哎,这是咱们接下来要告诉他的啊,那怎么告诉呢?
16:06
来还是点那个new.new的时候,这回点谁第二一个new cube。Q吧,就是是不是定义Q呗,啊对吧,这就是定义计算规则了,你看前面是不是一个立方体对吧,咱们点击Q吧,完了之后你看啊这块怎么做,一共有七个步骤啊,咱们一个来先看第一步choose model是不是得选择一个。那个星星模型啊,对吧,那咱们是不是点之前自己创建那个就可以,那这样呢,你这个cube也需要起个名字,那咱们比如就叫做older detail cube啊,是不是订单明细的一个Q呗,对吧,那完之后这块可以配置一些通知,咱不配了啊,点击下一步啊,那现在我们要是不是又要选dimension,注意这次你选择dimension啊。自选底门那就可不是那啥了啊,可就不是说随便选选了,这次你选什么的就算什么了,能理解吧?好,那现在我们点击I dimension。好,那你选维度字段的时候呢,是不是也是可以从事实表当中选,也可以从维度表里面选呀,对不对,那这回大家选的时候就不要全选了啊,因为你选的越多,你的计算量是不是就越大呀,对不对?那咱们简单分析一下啊,如果说我选五个字五个维度,那你的q boy的一共有几个?
17:19
二的五次方减一三十一个呗,对不对,那我要选选三个呢。二的三减一等于七,你看啊,是不是只差了俩维度,但其实你那个Q8的个数已经翻了翻了好几倍了,对吧,对不对,那它是一个怎么样的一个增长方式啊,二的N次方减一是一个爆炸增长,对不对,也是你选的维度越多,你的计算量越大,所以大家现在因为是虚拟机这个环境,所以说我们大家选的时候呢,要慎重啊,少选几个,那我这个我就选,比如说我就选四个维度吧,选四个维度应该是二的四次方减一等于15个,对吧,大家如果觉得自己的慢啊,电脑不行,你选三个选两个都可以,能理解吧,那我这边选选几个,我选我选四个啊,选四个那怎么选呢?看看我对啥感兴趣吧。
18:04
那比如说我这边这个用户维度表当中,哎,我想分析一下这个不同的性别可不可以选,可以选吧,那下下边呢,哎,这儿有不同的省份,不同地区,那这俩我都感兴趣,那是不是可以都勾上对不对,那下边呢?这里边你看你想对谁分析啊,咱们这个选一个的,选一个品牌吧,好吧,咱们一共选这样的四个维度啊四个维度那完之后,选完维度之后你会发现啊,咱们所有的维度表当中的这个维度啊,啊事实表这是不是没有选项,所有维度表上的这个这个维度选项都有俩两种类型,一种类型叫做什么所谓的normal。Over是啥意思?啊,正常的普通的对吧,那还有一种呢,叫做derived derived翻译过来叫衍生,衍生啊,这个衍生维度呢,是我们后续要讲的麒麟的优化的一个点啊,优化的一个点,那这边呢,我们呃,刚开始学,所以咱们现在先不涉及到这个优化的东西啊,都是一个derive的这个东西,咱们呃先不选啊,咱们为了方便理解呢,我们先选前面这个normal,都选normal啊,都选normal。
19:10
来了,这也很normal,看到没有,我四个维度是不是都是normal,都是普通的那种,对吧?啊,就是跟咱们之前讲的是一样的,就是普通的啊好,那完之后呢,点击OKOK,一定得点好,大家看我四个维度是不是就选好了呀?啊完了之后呢,点击下一步next,那接下来呢,我们来到了下一步就是这个measures啊注意个measures在这儿呢,我们可就不是说只选一个字段就完事了,你得告诉麒麟啥呀。是不是得告诉麒麟什么东西,你得告诉麒麟我的度量值是啥吧?啊,这个除了告诉度量值,还得告诉他,还得告诉他你的聚合函数是啥对不对啊,你得告诉他你聚合函数是什么,那这个怎么告诉他呀?其实这其实已经有一个了,是不是已经自带一个了,但是它自带了一个count星啊,对吧,一个count的啊,注意这个你不要删,这个你不要删麒麟它内部呢,会使用这个count值啊,它会统计这个技术会用啊,所以这个你不要删,不要删啊,完了之后你看这是不是有一个expression。
20:06
Expression就是表达式,其实就你那个函数函数它用的是count吧,对不对,那接下来呢,我们还可以加其他的,比如说这呢。加强是不是加mirror啊对吧?点,比方说你看这怎么用啊,首先起个名字,比如说我这儿呢,啊,需要对原始金额进行求和,那你就sum original ori original amount。是不是取名字啊,对吧,那你的表达式是啥?上面求和也可以,求最大最小平均值count count都可以啊好,那咱们求求和,那求和你求的是哪个呀。那是不是这个参数有两种类型,一种是列,一种是啥常量值,那我们肯定是求某一个列对吧?那column column谁呢?那下边是不是有那度量是不是下边都是度量值,度度量值我们选了好几个啊,比如说我找谁original amount是不是就它,哎,那就完事了呗,那这样你是不是就点击。注意这个OK一定得点啊,不要直接点下一步,直接点下一步,相当于这个度量值没保存对吧,那一定得OK。
21:04
好,那你看这是不是就有两个度量值了,看到了吧,那当然我们这你像刚才咱们这张表,我的度量值很多,我不想一个一个加,那你可以怎么做呀,可以怎么做,可以点这这是不是有一个book a mirror啊,什么意思,批量添加度量值啊,批量怎么批量啊,这个我可以删除啊,把这个不告诉他了啊,它自带这个千万别删啊,自带这个人就会用的啊,不要删,那这会我们点击批量添加,你看这个能不能看懂啊。批量添加呢,相当于首先你先选函数,我函数是不是sum求和,我都求和,那你是不是点sum,然后下边是不是你缩小度量值直接怎么办?全选,点击OK。五个度量值是不是就出来了?能看懂吧,哎,他就这么去做的啊,那这里边呢,你就按按按按根据你的需要呗,你需要几个你就选几个就行了啊,那当然这块呢,我还可以再添加几个,比如说来我这回我还得想再求一个这个最大值,最大值是不是再点一下。
22:02
OK。是不是十个就出来了呀,对不对,那当然这个太多了啊,我这个不让它有这么大计算量,我这个调小一点啊,我把这个最小值,这个最大值我就全删了啊,所有的max都删了。啊,我只留下这个求和吧啊,我求这样的,呃,比如求五个和啊,求五个和好,那这个完了之后是不是可以点击下一步了呀,那点击next,好,那接下来呢,我们又来到了下一步了啊,前面基础配置已经完事了,那后边的这个是相当于一些跟呃我们这个优化相关的一些东西啊,那接下来咱们先看这个当前这一步,Refresh setting refresh,是不是刷新的意思啊,对不对,刷新的意思啊,那这里边我们只需要关注这一个参数就行了啊这个叫什么呢?叫做auto。什么,Merge thread holes?Auto me threadhold,这个是啥意思呢,这个。自动合并的一个阈值是吧,对不对,那什什么叫自动合并,给大家解释一下啊啊,那刚才提到了我们麒麟那是怎么算是离线计算对吧?离线计算我现在是不是已经定义好了一个QB了,那离线计算咱们应该让他怎么算,是不是一天一算呀,我一天算一部分数据,一天算一部分数据,然后麒麟的底层是这样去做的啊,它每算一天的数据都会在h base当中建一张新表。
23:20
注意不是往一张表里写,它是一天的数据,我写到一张表里,一天的数据写到一张表里能理解吧,那随着时间的推移,那你这个数据量越来越大,那你的表是不是会越来越多,对不对?表越来越多,你查询数据的时候是不是肯定会跨表查询。对不对,那在HP当中,我跨表查询呢,我这个性能不会太好,不会太好,那所以说那这边它会怎么做呢?它会自动的帮你去合并,合并什么,注意不是合并h file合并啥合并表,它会把多张表合并到一张表里,理解吧,啊是这样的啊,那这边具体的合并的这个策略是啥样的呢?你可以设置这个合并的时间啊,它默认是这样的两个级别啊,怎么两个级别呢?七天一小病,28天。
24:05
一大病。嗯,是这样的啊。一天一小病,28天一大病,那具体的这个合并的这个步骤是啥样的,就是这样的啊,等你第一天,第一天是不是会有一张一天的表啊,对不对,那随着时间推移啊,到第二天,第三天,第四天第五天,那这都满足这个合并的策略吗?满足吗?不满足对吧,因为你现在只有五个一天的,直到第几天。七天的时候,你是不是有七个一天的表了呀,那他这时候会先检查谁啊,先检查是否满足28天满足吗?不满足不满足七天满不满足,满足满足的话,那我是不是就直接合并成一个七天的表了。啊能理解吧,那随着时间的推移走走走,那到了第八天是不是有一个一天的表,那这个满足28天吗?不满足满足七天吗?不满足那鸡说走就走走。对,那这时候呢,到第几天的时候呢,14天的时候啊,那是不是现在有七个一天和啊不是啊,有一个七天和七个一天,那这时候是不是满足七天,那所以说这时候呢,我又会合并,合并什么呀。
25:06
两个七天的,那一直走走走,直到有什么时候呢,直到你有三个七天的和七个一天的,也就是第28天的时候,那这时候是不是先检查满足500多满足吧,直接合并成一个28天的啊,他是这样去做的啊,那大致的思路就这样啊,那这边我们让他保留这个默认值就行啊好,完了之后呢,我们点击下一步啊,其他就不用管了啊,下一步呢,我们来到了一个叫做advanced setting这样的一步,Advance setting是不是就是高级配置啊,这都是跟优化相关的,比如说什么aggregation group聚合组啊,什么ROK的优化,这都是我们后下午会讲的东西啊,咱们现在先不用管,直接下一步就行。好,那这边有一个什么configuration or rice,那这边呢,相当于可以干啥,你可以在这个页面上去配置一些参数啊KVKV,那当然在这块配的呢,你要注意它是什么级别的啊,什么级别。
26:01
是cube ly是cube级别的啊,也就是说你在这儿配的参数只对谁有效,只对你当前的这个cube有效对不对啊,那如果说你要想全局配置的话,你在这配有效吗?不行,全局配置得去哪配呀?得去咱们底层C点帘是不是得去麒麟的抗复目录里边去配啊。到这个康复。哎,这里边是不是有各种各样的这个配置文件呀,啊,那在上边配的它覆盖的是哪个地方,覆盖的就是这个K0.properties啊,也就是说哎,你要全局配你就得在这配,那你要不想全局配,你就在这儿配就行了啊这个记住就行,好咱这就不加东西了,我们直接下一步。好,那点击这个C保存。点击yes。好,那到这儿呢,我们相当于就完成了整个cube的配置了,好,那q cube配置完了之后,那接下来干啥呀。现在开始,它现在开始计算了吗?没有计算,你是不是得让他提交任务才能计算呀,对吧,那怎么提交呢?来出现了一个Q,那我们点一下这个action里边的这个按钮完之后呢,点谁点里边的build点。
27:10
点完之后呢,你会发现它弹出来一个日期对吧,一让你去选一个日期对吧,那这个日期包括一个start date,包括一个end date,一个开始一个结束,而且是什么样的呀,是左臂右开的对吧?Include exc include包含和不包含啊,那假如说我现在呢,想因为咱们是离线,离线计算对吧,离线是不是一天一天算呀。那比如说我现在算最新一天的十几号了,15号,那你这应该怎么选。怎么选,是不是选到六月15准,然后15,然后呢,12.am,这就是零点啊点点,那是不是6月15号00:00:00 OK,那结束日期呢,这其实可以改的,直接改改多少就行。点16没错吧,六十五六十六,那我们现在就可以点击submit提交了,对吧,等你提交那这个任务呢,就开始跑了啊,这个rebuild job was submitted,这个successfully啊提交成功,那提交成功之后,他提交到哪去了呢?
28:11
谁谁在做计算呀,现在大家说。谁在自己钻?谁?默认是mmr啊,默认是mmr啊,默认是mmr,也就是说现在呢,是不是任务已经提交到了盐上面了呀,对不对,就像盐上面了啊,那这个在页面上,我在这个页面上,我其实也有一个地方能够监控这个任务点哪呢?Monitor啊监控啊点。然之后呢,你看这个是不是就是刚才我们所提交的那个build的cube,也是构建cube的那个任务啊,啊已经提交到这儿了,那提交完之后呢,我们来接着往下走啊。那这个后边是不是有一个蓝色的箭头,这个蓝色箭头呢,我们打开之后,可以看到我们这个构建cube的一系列的步骤,你看啊,从第一步开始,从上到下,这是我们麒麟构建的每一步工作啊,一步一步的走啊,然后呢,它当前执行到哪一步了,哪一步呢,就是蓝色的这种状态,如果执行成功之后,那就是一个绿色的对勾,如果报错了呢,就是一个红色的啊叹号。
29:10
啊,是这样的啊,其实跟阿德卡布那个颜色是一样的,对吧?蓝的正在执行,绿的是成功,红的呢是失败,好,那你在这儿呢,就能够看它执行到了哪一步了啊,是这样的啊OK,那大家可以看一下啊,那执行哪一步的时候,是不是每一步这儿都有一个小按钮叫log呀,对吧?这就是他执行过程当中所打印的日志在哪日志啊,你从哪从哪能看出来,如果哪块报错了呢?是不是能够通过这个日志查找这个错误信息啊,对吧?咱们得会看这个日志才行。啊,然后呢,现在给大家说一下啊,说什么事。这个东西是一个啥,从头到尾这一个什么。工作流程,这就是一个工作流程,它也是有前后的依赖关系的,第一步完成之后,我才能做第二步,第二步完成之后才能做第三步啊,因为你考虑到我们那个计算逻辑,是不是先算最高维,再算再依次降维,对吧,那这是不是就是一个计算一个一个工作流程啊,对吧,那第一个完了才能算第二个啊,依次往下走啊,那所以说呢,他在这儿呢。
30:05
是不是就能够体体现到一个服务的一个作用呢?谁的作用啊,就是那个历史服务器的作用啊,咱们前面说了,为什么启动麒麟之前,咱们要启动历史服务器啊,为什么呀。其实这跟这块它是有关系的,那麒麟呢,它其实这样去做的啊,它会根据历史服务器上边你这个任务的状态去判断这个任务是否成功了。如果那个历史服务器上显示这个任务已经结束了,已经是非内是这样的一个状态了,那他是不是就可以提交下一个任务了呀,对吧?那所以说这个历史服务器是咱们必须得起的,大家自己去做的时候呢,也一定要记得起,不要忘了啊啊,那到现在为止呢,我们其实就已经带着大家呢,从头到尾的把麒麟的这个使用过程过了一遍了啊,那咱们现在要做的事呢,就是等着它计算啊,来,我把视频录一下。
我来说两句