文章/答案/技术大牛

发布

首页视频247_尚硅谷_即席查询_Kylin_使用_定义cube

247_尚硅谷_即席查询_Kylin_使用_定义cube

2022-12-022022-12-02 16:02:23播放34

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/247_尚硅谷_即席查询_Kylin_使用_定义cube.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
那现在我们看看这个cube咱们怎么去定义啊，呃，那同样现在还是点这个绿色的这个new，这时候呢，点这个new cube，你看前面是不是一个小方块，这指的是咱们那个cube啊点点完之后呢，这回我们去定义cube的时候呢，同样是分为这样的几步啊，我把这个拉到这边吧，拉这边比较合适啊好大家看，那这边呢，我们需要有呃这么多的七步啊，咱们一步一步去做，先在第一步，第一步是这个QB，首先它要我们去选一个model，因为你的CU吧，是必须得基于某一个model的啊，对吧？好，那现在咱们选选这我的payment不就有了，咱们选过来那起个名字，那这个我叫什么叫做pay，这个payt。呃，Payment cube好选完那下边呢，我们这其实可以配置这个通知的，配置通知，那咱这就不配了啊，我们点击。好，那接下来这时候我们是不是又要去选dimension和Mary呀，大家这回要注意了，刚才咱们定义猫的时候，选的时候那些你不一定都计算，但是我这时候选的dimension选的我就是真正要计算的了。
01:02
哎，这回要注意啊，那我们看看我们点击I的D点完它之后呢，我们这里边呢，需要去选我哪些这个维度要进行计算，那这时候呢，咱们来看看我们需要选什么啊，那这会因为这会候你要选多少你就算多少了啊呃，而且算的时候是多少，是不是二的N次方减一啊，所以大家那个电脑要是比较菜的话，那你这块少选几个啊，不要不要全选上少选几个，那比如我电脑就不行，那我少选几个啊，那比如说在这个事实表当中呢，我选一个什么，选一个这个支付的类型。Payment type，诶，它可以作为一个分析问题的维度，然后再往下。下边呢，呃，有什么呀，有这个真的真的是不是就是这个用户的性别呀，还有user level用户等级，我可能这俩都关心，都关心，我都给他选上。对不对，那下边还有什么该这个，呃地区的地区地区表，那这里边呢，我可能我对谁啊，我我可能对region感兴趣，那省份我就不选了啊，因为我这个电脑比较菜，我少选几个，那OK，下边呢，呃还有什么，还有这个日期的日期的呢，呃，如果说你没有没有没有分析的指标，那我们就不选它了，你就不选就行，那这时候呢，就相当于我们是不是已经选完了，我选了几个，我选了一个这个两个三个，我选了四个。
02:10
大家如果不行的话，你就选三个，选两个都可以啊，不要多少选点，就是计算量会少一些，好那这个玩意儿之后呢，我们来看一下啊，咱们在选维度表当中的这个维度的时候，咱们跟选事实表当中的维度是不一样，这事实表实表这是空的对不对，那下边这个维度表这边呢，有这个选项。对吧，那选项里边有什么normal，有derived normal什么意思，就是普通的正常的意思，Derived呢，是这个衍生的意思，衍生的意思啊，那这边我们衍生维度呢，是使用麒麟当中的一个优化手段。优化手段，这个我们放到后边高级部分来讲，那现在呢，我们就全部都选为正常模式。诶，全部选为正常模式二衍生这个东西呢，我们后期再讲，那全部选为正常，好，那也就咱们选了四个，这个相当于选了四个维度，对不对啊，四个维度好，那选完之后呢，我们点击下边的这个，呃，OK，点它。
03:04
好，那四个维度咱们就选完了，选完之后呢，我们接下来紧接着点击这个next。这时候呢，需要我们去添加mirror，那添加mirror的时候呢，那这次我们就不是说只选一个字段那么简单了，对不对，因为你最终你要干什么，你这个要聚合，聚合完之后是不是肯定得有一个聚合函数啊，对不对，那这边你要求什么，你得告诉他，就比如说它这有一个自带的，自带什么是这个count。就是会有一个这个分组进行这个计数的这样的一个功能，这是它自带的，自带的啊，那这个东西你要不想要也可以删掉对吧，那我们现在可以加上我们自己想要的怎么办？点击这个加mirror。那下边呢，首先起一个名字，那这边比如说我要分析的就是这个前面的维度跟这个订单金额总和的规律，那我就怎么办，我就起个名字，这个随便起啊，比如some。啊，那下边诶有是不是有一个表达式啊，那这边能选什么呢？来看啊，N都能求啊，这个常用的几个都能求，这是这边。
04:02
那完了之后呢，你sum函数是不是得有参数啊，对吧？那参数这里边可以是常量值，Content也可以是一个列，那我们这肯定是一个列呗，对吧？选column column完之后哪个列呢？诶是不是肯定是那个度量值啊payment amount肯定是它好，那我们给它选上就行了，选完之后，那这时候呢，大家注意啊，不要直接点next，你点next这个东西相当于你没保存，那你得点一下OK才可以啊，点OK，好，那出现这个位置，你看是不是有俩了呀，俩了之后呢，你再点这个N。好，那到现在为止，我们就已经定定义好了，咱们这个这个度量值了，那再往下呢，实际上就是一些高级的配置了，比如说现在这呢，有一个refresh setting refresh什么意思呢？Refresh它的意思是这个，呃，合并刷新的意思，那这边呢，我们主要给大家讲一个参数就行了，就这个位置autoge这个自动合并，对合并自动合并。刚才咱们分析过了，我们刚才分析过了啊，就是我们的麒麟呢，是这样的，我们定义好一个Q吧之后，对不对，那我们计算的时候怎么算的，是不是一天一天算的对吧？我每一天算完之后呢，我我会把结果怎么是不是存到h base当中，每一天算完诶都会把相应的结果存到h base当中，那大家要注意了，我们数据存到base当中啊，我每一天的这个，诶这个数据呢，我都会存成一张表。
05:25
每一天的数据都会存成一张表，就是一天一个h base的表，一天一个H的表，然后在这个麒麟当中，我这一天的这个表在h base当中，我管它叫做一个什么东西呢？我管它叫做一个segment。S格的意思就是就是切片分片的意思啊，对吧，相当于我一天一个片，一天一个片，然后一个片就是一个表，一片一个表，那这样一来的话，如果说随着时间的推移，我们h base当中啊，可能会有大量的表，对吧，一天一个表吗？大量表，那有大量表有什么坏处呢？这个其实坏处也倒也不是很，也不是很坏，那表多了，可能我那个HP的原数据那要多一些，对不对，这是有可能的，那其实我们这个倒无所谓，倒无所谓，那其实对对我们这个麒麟来说，我们使用的时候，我这个比较多了，对麒麟来说有什么坏处呢？其实有坏处的什么坏处啊，就是我们去诶查找数据的时候呢，它有可能会有问题，比如说我后续我想干什么，我想去查找一下咱们那个，诶半年的数据。
06:23
我把半年的数据，我这个结果我拿出来，我统计，我最终看一下这个结果，我想看一下，那这样一来的话，会出现什么问题呢？会出现你需要去扫描这个半年的表，半年的表相当于有180张表，你需要去去去扫描对不对，那这个其实查询的时候效率呢，可能会比较低，那所以说在这呢，我们麒麟有一个这样的功能，什么功能，就是自动合并表的功能。自动合并表啊，也就是说它会自动的帮我们把这个每天构建出来的那个表给它合并到一起，那合并的时候它的规则是什么样的呢？我们可以自己去设置，这样呢，它的默认配置是七天一小病，28天一大病。当然不是生病啊，是合并啊，就是七天合并一次，28天又合并一次，是这么去做的啊，那这边它的具体的合动的规活，那个合并的规则是什么样的呢？给大家解释一下，可能你想象不到它是怎么合并的，比如说七天一小病，28天一大病，那我到底是怎么合并啊。
07:15
是不是感觉想象不到啊，诶是这样的，我给大家解释一下啊。OK，他这个每天生成一个新表的时候，他都会去按照你定义的这个规则去检查一下，他先检查什么呢？先检查是否满足28天的条件，如果满足28，那就按照28的合并，如果不满足，在线检查是否满足七，那满足期就按照七合并，如果都不满足就不合并。是这样的一个逻辑啊，那我现在举一个例子，看看是怎么回事。诶，这时候大家看谢波提的这个问题，说跟h base的合并一样，这块大家千万要把这把它跟H的合并给它区分开，它跟h base的合并不一样。这个要注意啊，H base的合并指的是什么？H base的合并呢？指的是你一张表里边的，对不对你的那个h file进行合并吧。
08:04
对不对，你是HFA进行合并，这是一张表的HL进行合并，我们这麒麟这边所说的这个合并指的是什么？是什么是诶多个表进行合并，是多个表合并成一个表。这块呢，大家一定要区分开，不是HL的合并啊，是表的合并，好大家把这个记住啊，好，那我们现在继续往下讲，我们看看它这个默认的这个合并规则到底什么样的啊，好比如说我我举例子啊，比如说我现在诶第一天有一个一天的表对不对，那这时候满足28，不满足七也不满足，所以不合并，那依此类推，123456。七诶到第七天的时候，那我现在检测28满足不满足不满足，那是否检测七满足满足满足满足，那OK，我就会把这诶七个一天的表给它合并成一个七天的表。那这是一个七天的表，那OK，那接下来我们到了第八天又来了一个一天的表，那满足28嘛，不满足七满足嘛，也不满足，那这时候呢，他就会继续走走走走走走，那到多少时候呢？到第14天的时候，那我就会有一个七天呢和七个一天的，对不对，那这时候满足28吗？不满足七呢，满足满足满足OK，我就会有两个七天的表。
09:15
对不对，两个七天的，那依次类推，那直到什么时候，直到我到了28天的时候，我现在是不是应该是有三个七天的和七个一天的呀，对不对，那这时候先检查是否满足28满足，那OK，统一的合并成一个28天的表。这就是他这个合并的一个逻辑啊，那这边咱们就用它这个默认的就可以好，那它完了之后呢，我们接下来直接点击next啊来往下走点击next，这是咱们这个合并这边，那再往下呢。到第13天的时候，不就满足七天的要求了吗？第13天的时候不满足啊，13天的时候我是呃，有这个一个七天的，一个七天的，然后六个六个一天的呀，他是没法合并的，得七个一天的才能合并。是这么合并的啊好，那这个咱们继续往下看啊，下边我们点击next之后呢，我们就来到了谁，我们就来到了这个advanced setting来到了这个位置。
10:10
Setting，那来到这之后呢，这是一些高级配置，这个其实跟我们什么呀，跟我们那个HP的，跟那个麒麟的优化是相关的啊，那这个优化的概念我们现在还没说，所以这边呢，咱们就先跳过，先不管它啊，那直接点击next。然后再往下呢，这边也是就是说我们可以去配置一些属性，在这进行配置，刚才咱们不是看了吗？给大家就是我们在这个麒麟当中，我们可以去覆盖一些这个have的配置，呃，以及覆盖一些咱们那个MR的配置，对不对啊，那你想要想覆盖的话呢，你可以直接修改配置文件，那配置文件改了之后是全局有效，那你在这呢，也可以进行配置，在这配置完之后呢，就是只对你当前那个cub有效。对不对，那加，然后诶给它配上就行了，是这样的啊好了，那这个完事之后呢，我们点击next。然后最终这是我们这个cube的一些信息，就是这样了，那这里边呢，有什么，有几个这个维度表，有几个维度，有几个度量，那就给你列出来了，那最后点击save，然后点击那OK，那到现在为止，咱们这个麒麟的Q吧，我就我就已经定义完了。
11:11
就定义完了啊，那定义完之后，接下来我们就可以让他去进行这个计算了，那注注意啊，这时候只是定义完了，其实并没有计算，计算怎么办？来点一下咱们这个Q吧，这块已经有东西了，对不对，点哪点这个位置。Actions啊action，那这里边呢，有一个有一个build，这个build呢，就是一个计算，就是构建吧，然后点它点，那这时候呢，会弹出来一个那个输入框，让我们去把什么输进来呀，让我们去把这个呃，输一个起始的日期，再输一个这个结束的日期，对不对啊，那这时候他这个日期这个前后是什么样的呢？是前边是include，后边是c include应该就是这种形式呗。对吧，是这种形式的啊好，那这里边儿我们要计算，比如说我们现在集群当中有这个好几天的数据，对吧，那我现在想计算十号的数据怎么办？那计算十号那你选呗，那其实日期那应该是选这个上一个月的啊三月呃，三月3月10号十号，然后这个12点这个am，这其实就是零时啊零时。
12:12
这不是，这不是中午12点，这是上午12点，上午12点就是那个零时啊，可能有点别扭是吧，那零时，然后这个零分对吧，那就是3月10号这个位置就选上了，那完了之后呢，结束日期应该是谁？那结束日期是是不是应该是3月11号的零时啊对吧？那选3月10号11号的零时，诶那这样一来我是不是就能够把十号这一天的数据给它过滤出来了呀，那完了之后呢，点击submit，点完它之后，大家要注意这时候呢，我们就诶真正的去进行计算了，这时候就真正去计算了啊，那我去哪看它这个计算过程呢？看这个位置monitor。那这边呢，就把咱们这个计算过程呢，给大家列出来了，列出来了啊好，那列出来之后呢，我们来给大家简单的说一下这里边儿的一些东西啊，这是这个有一个执行的进度，一个进行进度啊，然后这边你可以刷新，可以刷新，那然后大家看看这个位置啊，这个位置是一个小三小小蓝色一小三角，你点一下这个按钮啊点。
13:09
点完之后呢，你往下看啊，往下看，那下边有什么东西呢？下边有咱们这个就是构建任务的这个整个的一个流程。构建任务的整个一个流程，因为咱们这边，呃，实际上说白了，底层你去计算的时候，是不是也是map reduce啊，也是需要一串map reduce的一串和一串啊，那大家想一想，那既然是这样的话，那相当于我多个mmr之间形成了一个什么，是不是形成了一个work flow啊，对不对，那多个任务之间是不是有依赖关系的呀，既然是有依赖关系，我得确保什么，就得确保是不是第一个mmr跑完了，我才能跑第二个，第二个跑完才能跑第三个。对不对，他得这么去算才行，那所以说大家想一想，我怎么知道第一个是否完成了。对不对，你得保证他完成了才能跑第二个怎么知道怎么知道，诶那麒麟是，诶利用咱们这个历史服务器去判断这个事儿的，也就是说诶，我第一个MR提交了，那OK，那我是不是就会去监控这个历史服务器上的这个任务啊，如果说你在历史服务器上边，你这个任务的状态变成了succeed，变成成功了，那OK，我才会去提交下一个MR。
14:15
对不对，那这就是我们麒麟使用这个历史服务器的这个场景，所以说麒麟呢，要求我们必须得启动历史服务器，得启动历史服务器啊，这个大家得记住好了，那这时候呢，它就会诶一点一点从上到下去跑了，那这个最终呢，这个跑完之后，这个位置呢，会变成100%，那这个就是咱们麒麟的这个基本的使用过程，就是从从哪呢？从去定义这个呃，Model，然后呢，再去定义这个，诶Q吧，那Q完之后呢去计算，计算完之后呢出结果，出完结果我们就能去进行查询了，这是咱们完成了计算的这一步了。好了，我先把视频录一下啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（171/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

340

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

247_尚硅谷_即席查询_Kylin_使用_定义cube

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐