文章/答案/技术大牛

发布

首页视频256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

2022-12-022022-12-02 16:02:23播放45

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
OK，那我们来看一下这个，呃，RO的这个优化，看一下RO的优化啊，那这个RO的优化是什么啊？呃，所谓的RO肯定是h base的R，那h base的ROK设计是不是呃，通过Q报的ID加上那个维度值来进行这个组合而成的呀，组合成的那这个东西呢？他这个我们这个设计的这个模式是这样的，那我们是不能改的，对不对，我们优化是优化不了它这个结构的。但是我们能优化什么东西呢？我们能优化的是诶维度的顺序。我们能优化的是维度的顺序，这个所谓的维度顺序是什么样的呢？看一看啊，我们前面只讲了我这个有一个Q报的ID，那Q报ID如果说四个一全是一，那就说明我是所有维度都有的，对不对？但是咱们并不知道你第一个一指代的是哪个维度，第二个一指代是哪个维度，咱们并不知道那个事儿对不对，那其实我们这儿它是有一个默认的顺序的，有一个默认顺序，然后我们能干什么呢？我们能优化的点就是我可以去调整这个维度的前后顺序。
01:03
我能去调整这个东西，别的咱管不了，只能调整它，那我们调整这个，呃维度顺序的时候，我们的原则是什么呢？咱们的原则这样的一个原则，呃是什么？是被用作where过滤条件的维度放在前边。也就是说你构建完这个cub之后啊，那后续我进行查询的时候，我可能会以某一个维度作为这个VR过滤条件，那这时候呢，你就需要把这个VR物理条件的维度呢，放在你这个R的最前面，放最前面，这是一个原则，那原为什么这样，那一会看原理啊，咱们一会再看，那下来我们看谁看这个下边。下边是这个，呃，基数大的维度放在基数小的维度前边，首先啊，先明确一下什么叫做基数。什么叫基数啊，什么叫基数，所谓的基数呢，其实就是你这个维度，呃，那个字典表的那个，呃，那个长度维度字典表的长度啊，说白了就是呃，比如说咱举一个例子吧，咱们比如说我这有一个月份的维度，一个月份的维度。
02:03
那月份的维度，你想我们这个月只能有什么，一月二月三月四月五月六月七月八月九月十月11月12月对不对，那也就是说月份的这个基数呢，其实就是多少，就是12。对吧，那日的的维度是多少啊，那31呗，对不对，那其实说白了就是对这个维度的一个count distinct，这样得到的一个结果，其实也是它那个字典表的长度。就是一共诶到多少，那个自然值最大到多少，就是这个所谓的基数啊，它那原则是什么呢？原子是基数大的维度，放在基数小的维度前面。这是这俩原则，好，那我们现在逐一看一看这俩原则它到底有什么道理，先看第一个。大家来看一下，那现在这个东西呢，就是我们最终在h base当中我们存的一个结果，这就是在h base当中存的一个结果啊，H base里存的一个结果，那既然是这样的话，我们来看看我们前面A和B是什么，A和B是这个维度。A和B是维度啊，AB是维度，那C呢，是最终的这个count的那个聚合值，聚合值那大家都知道我们在h base当中其实存的不是具体的值，那存的是什么？是那个维度，维度的那个那个那个value对吧，是那个数字对吧？但是我这如果写数字的话呢，大家可能看起来那个比较比较比较比较那个不清晰，就是不是那么明显，左手这呢，又把它还原成了咱们具体的这个维度值了。
03:22
又还原成具体位置啊，但是实际上你写维度值跟我写这个呃数字，那其实啊，它这个顺序是是一样的，顺序是一样的啊，因为我们在这个h base当中，我们存是按照什么存的，我们是按照这个字典顺序存的，对不对，按字典顺序存，那按照字典顺序存，也就是说我需要是不是先比较前面的维度，再比较这个后边的维度呀，咱是这么去比较的，那我们来看一看它这边是怎么去比的啊，我们来简单来看一下，先看一下这个，先看一下什么，先看一下这个第一个维度，这个A，然后看这个，呃，再看B啊，那A这边呢是什么？一是数字一，然后B，呃，B呢，B是什么？B是这个是字母，那字典顺序先比第一个，再比第二个，那最终得到的顺序是不是应应该是这样的，1A1CE2A2B2C2呃2D，对吧？应该是先比前边后比后边。
04:12
对吧，是这样的，那呃，我们接下来看看我们有什么样的需求啊，我网上的需求，我的需求是什么呢？就是这个需要去把咱们这里边的数据查出来，查的时候呢，我的过滤条件是什么？是这个呃，B大于等于小B，然后B小于等于小C。那B这个字段对不对？大于等于小B，然后小于等于小C，那也就是说我需要的数据应该是分怎么分布的，应该是这么分布的。实上是这部分数据我要查出来呀，那你想一想，你要查这部分数据，呃，你想一想啊，咱们最终我数据要去哪查，是不是要去h base h base里查，那很显然，咱们去h base里查数据的时候，我们应该用哪种查数据的方式啊？HS2种方式，一种是get，一种是SC，对不对，那很显然咱是不是应该是SC，那SC我们什么时候干的时候效率是最高的，什么时候效率最高的就是你要查询的这个数据啊，如果说在h base当中，我是连着的，我是放在一起的，那这时候我查询的时候，我这个死干是不是效率才是最高的呀？
05:10
对不对，那其实我们HS使用有一个这样的原则，就是我们去设计K的时候呢，我们有一个这样的原则，什么原则呢。这样的原则就是说什么呀，就是你后期诶，要一起查的数据，尽可能给他在写的时候放到一块。这个原则记住啊，就是说你设计HOK的时候一个原则就是诶你后期要一起查询的数据，诶尽可能保证他写的时候能写到一起，能连着写，诶这是我们设计OK的一个原则，那这样一来我们就得想想想什么呀，想办法把咱们这个数据是不是让它分布在一起啊，那怎么让它分布在一起呢？我们只需要把这个两个诶肉两个这个维度的顺序给它调整一下就可以了。调整下就可以了，怎么去调整看，那我现在把B放前边，B是不是外过滤条件，那我是不是给它放前面，放前面之后我再去查这个数据的时候呢，那你看咱们的数据是不是就连连在一起了呀。
06:06
诶，那因为B在前边嘛，你先按照B排序对不对，那这就是咱们这个所谓的这个第一个原则就是诶被用作诶过滤条件的维度，咱们放在前边目的是什么？目的是我查的时候呢，能够更快一些，咱们用死干去查这种连续数据的时候呢，是是最快的是最快的啊OK，那其实这块大家也能想到，那如果说这个数据分开，分开之后，那是不是很有可能我这些数据根本都不在一个region里边，是不是都是有可能的呀？哎，对不对，那所以说你你还有可能去去去便利多个region，那这边我如果说数据都挨着的话呢，那我查询效率肯定是要比分开要高很多。这是咱们第一个原则，其实这个原则呢，还是比较好理解的，那接下来咱们看第二个原则啊，第二原则可能相对来说就呃，就稍微的麻烦一些了啊，我们来看一看这个基数大的维度，放在基数小的维度前边，首先还是先明确什么叫基数啊，就是那个所谓的维度的count distinct的值的大小，好，那现在往下看。
07:03
下边呢，是这个它的原理，它的原理啊，那我们一起来看看这个所谓的原理是什么。那我们来说一下啊，我们刚才那个rock的原则呢，就是第一个原则，那是针对什么去优化，是针对我后期查询去优化的吧，你要那么设计后期我查的时候我会诶更更快一些对不对，那这个呢，这个这个原则，第二个原则是针对谁呢？是针对咱们这个构建的时候，诶这个进行优化的。那也就是我这么去来设计这个OK的话呢，那我构建的时候，我计算的时候会更好一些，来，我们看它是怎么个原理来。那构建的时候，我们回忆一下我们构建算法啊，咱们两种，一个是呃，逐层构建，一个是这个快速构建，对不对，那甭管哪种构建方式，甭管哪种构建方式，我们的原则都是什么，都是先把最高位算出来，然后再依次进行降维，对不对，这是我们的原则，那这边咱就不管它是什么方式了啊，那我们就继续往下走来，那我现在已经把最高位算出来了，那接下来我算这个，呃，第一维的降维，那降维的时候，咱们最高是四个维度，那三个维度的应该有几个，应该有C43应该有，应该有四个才对，对不对，那我这边呢，我我就没有全画出来，我只画了俩。
08:12
一个是110，一个是1101，我只画了他们两个，那现在大家往往下思考啊，那两维的我算完之后，接下来要干什么？接下来要算三维的，接下来，呃，不是两三维的算完了，接下来算什么？要算两维的，对不对？两维怎么来，从三维而来。那现在比如说我现在要要得到一个这样的维度。这个1101只有A只有B，这边只有B，那你琢磨琢磨，你说诶，它应该由谁将将来。他应该由谁而来？应该是由由他来来行不行。是不是可以，我从这是不是把这个一给它去掉，我是不是就能得到这个。能得到吧，应该是没问题的，那咱们从这降能不能得到，也能得到啊，我是不是把这个最后一个维度给它去掉，是不是也能得到它，对吧，那也就是说咱们现在这个两维的呀，我实际上从他哎或者是从他那我都是能来的。
09:08
都能拿到，都能拿这个值，那我现在这个可能就比较麻烦了，我就得琢磨琢磨了，诶我到底应该从哪儿来呢。到底应该从哪来呢？其实按照我们自己的想法怎么来，是不是哪边数据量少，我从哪边来是比较合适的呀？对不对，因为你数据量少，那说明我这个计算的时候呢，我会干什么，我这个数据量就就就就小嘛，就计算的就快，对不对，这肯定是我们的想法，那麒麟是怎么去做的呢？看一下我们麒麟的原则是这样的，他选择的是那个q boy的ID比较小的。Q boy的ID比较小的，什么叫Q报ID比较小呢？大家看一下啊，我们的Q报的ID呢，实际上你可以把它当成一个二进制的一个数字，一个二进制的一个数，对吧？那比较大小呢，所谓这个大小就是按照这个二进制的比较规则去比较的，那这个跟这个谁大呀？很显然是不是右边这个是小的呀，对吧，右边这个是不是加个一，我才能得到这个左边这个呀。
10:03
是这样的啊，那他选的实际上就是一个Q的ID小的，那既然是这样的话，你说我们就得保证什么，我就得保证啊，是不是他选的这个那个数据量是比较小的呀，对不对，我觉得保证他选的那个数据量是比较小的。这个应该能理解是吧，那咱们如何去保证这个数据量小，那这个数据量大呢。怎么去保证这个事儿呢？你其实你可以，你可以想一想啊，就是说咱们把数据聚合到这个这个力度之后，那你想一想，你说这两边他们俩的数据量大小，其实是由由谁来说了算的。跟AB有关系吗？跟AB其实没关系，因为它俩相同嘛，相同的话我就可以不考虑这个因素了，我就可以把它排除掉了，那是不是也就是说决定因素就是C和呀，对不对，那这两边数据量的大小是由C和D的什么来决定呢？那是不是很显然是由它的基数来决定的？对不对，也就是看count第四个值由它来决定的，那也就是说咱们这就找到这个我们的这个一个一个原理了，什么原理啊，来往下看，那假如说我这诶。
11:08
假如说我这边的基数小，那这边的基数大，那是不是就能够让我们麒麟去选那个数据量比较小的呗，对不对，我这边D的基数是三，那这边基数是六对不对，可能我这边选的，诶，那就能够选择这个小的数据了。那就是这样，那也就是说咱们得保证什么呀，是D的基数要比C的基数是不是要要什么要要小才对吧，对不对，D的基数要比C的基数小，那也就是说谁呀，也就是说后边的基数是不是应该比前面的这个基数小。对吧，那也就是说最终就推到了我们这个最终的原理，什么原理，就是说基数大的维度要在前边，基数小的呢，我要在后边。这就是咱们这个这个原理，就是这个原理，那这个原理呢，大家就是说可能理解起来稍微的那个费点劲，但是这个东西呢，你要实在是不好理解，不好理解怎么办，那你把这个结论记住就行了，对吧，这个结论结论应该能记住吧，基数大的维度向前调，然后基数小的维度呢，我向后调。
12:06
就是这样的一个东西啊，呃，OK，那这个咱们就说完了啊，好，那我把这个呃说完之后呢，呃还不能录视频，还得干什么，还得告诉大家一下，如果到底怎么去调这个数，这个顺序啊，对吧，你光讲原理不知道怎么调也不行，怎么调诶，同样是在页面上调他这个麒麟，其实使用起来这个这个web UI呢，还是非常不错的，非常好用，那怎么去调整呢？来还是咱们在设计cube的时候去进行调整啊，然后点击N，然后点击N，点击这个N，还是在这个位置advance setting，刚才是不是在这设置了聚合组啊，那你往下拉，往下拉就是这个了。R，那下边呢，就是这边你那几个维度，你要想调整顺序怎么样呢？这是它的默认顺序，想调整顺序怎么办？诶把这个光标指向这个数字变成十字的时候呢，可以诶拖动，那这样一来你就把它调上面去了，那我把这个再往上调，诶是可以这样去调整的，那这个调完之后呢，它就按照你这个顺序来了，它这有一个默认顺序的啊好，那到现在为止呢，呃，我们这个这个所谓的这个呃呃，RK的调整呢，咱们就说完了，这个视频我录一下啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（181/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

330

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐