文章/答案/技术大牛

发布

首页视频246_尚硅谷_即席查询_Kylin_使用_定义model

246_尚硅谷_即席查询_Kylin_使用_定义model

2022-12-022022-12-02 16:02:23播放38

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/246_尚硅谷_即席查询_Kylin_使用_定义model.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
OK，那现在呢，我们看看这个咱们的麒麟应该是如何使用，打开外部页面登录进来之后呢，呃，进进呢和工作界面了啊呃，工作界面看起来是比较美观的是吧，大家看这个位置啊。这块呢，他让我们去选择一个project。这个呢，就是我们需要呃，使用麒麟的时候呢。需要先创建一个这样的一个工程，那这个怎么创建呢？点那个位置啊。这一个ID就是添加，那那就点。那点一下起个名字吧，比如说咱们叫做机贸g ma g ma在这个起名上面是名字下面描述信息，那接下来呢，完了之后，后边点一下这个submit提交，嗯。这时候点击success，点击OK，那这时候咱这个机帽就相当于是这个已经创建完成了，那创建完成之后呢，你看这个位置啊，就这已经自动的，呃，是不是已经选中了这个这个集贸了呀，那这个如果说你要是这种状态，那相当于你这个东西还是没法用，你必须得选中某一个这个product才行啊电击帽。
01:01
好，那选完之后呢，接下来咱们需要干什么呢？接下来咱们使其实使用麒麟，咱们应该分为这样的两部分，哪两部分呢？第一部分。配置它这个计算规则。什么叫配置计算规则呢？首先一你得告诉他你的数据源是什么，是不是得对接上，还有的数据源呢，那对接完之后下边干什么，你得告诉他哪个字段是维度，哪个字段是度量，这是我们需要去自己定义的，OK，这是我们定义，定义完之后，那麒麟就会干什么，就会自动的进行构建，也是自动进行计算，这是我们使用的第一部分，那第二部分是什么呢？第二部分呢，就是去查询了，写SQL查询，诶那思维这的两部分啊，那现在我们要做的是什么？就是去定义这个计算规则，也就是说去构建Q，或者叫做定义Q吧，定义Q吧，这是我们要做的事，那所以我们现在要想去进行计算，第一步咱要干什么呢？要要把这个数据先拿到对不对，也就先去配置数据源，数据源怎么去配呢？在这个位置data source。点击。然后这儿呢，呃，有这样的几个按钮来逐一的看一下啊，先看第一个load table，第二一个呢，Load table from tree，第三一个呢，是的stream table，那这里边呢，我们就是说可以呃使用前两个按钮去对接have里边的表，第三个按钮呢，是用来对接咱们的这个呃，实时的这个数据的，比如说对对接这个卡夫卡stream流失数据对接卡夫卡的啊，那这边我们演示的是这个。
02:25
呃，对接have出仓嘛，离线出仓，那所以说咱们点前面low table low table的时候呢，这边就是说你需要自己想导哪个表呢，你需要自己去写，写的时候呢，多张表之间用这个separate with，用这个逗号去进行分格，呃，然后这个写的格式呢，就是库名加表名，这个直接写have里边呢就可以了啊是能够对接上的，当然咱们这呢，不这么去写太麻烦了，我们点什么呀？诶咱们这个呃，应该点一下这个conso取消啊点取消，咱们这应该点谁呢？应该点它才对啊，点这个。Load table from tree，那这时候呢，你看是不是已经把咱们have数仓当中，我们这个数据库已经给咱展示出来了，那然后点这个积贸好，那数仓里边所有的表呢，在这就全部列出来了，点这个收或者收off，然后收off吧，咱们把所有本全部展示出来。
03:13
这是我们收藏里边所有的表。是这样的啊呃，然后这边大家想一想，它为什么能拿到这些东西啊，为什么呀，因为我是不是在配在那个机器上边配了还有变量了，Have有的环境变量了呀，所以它是能够访问到的，能够访问到啊好了，那现在呢，我们去接下来去干什么呀，接下来咱们去那个。看一看我们这边应该去统计什么样的表，那前面咱们讲过啊，我们麒麟它对接的是什么？对接的是咱们数仓当中的这个维度模型，那为什么他要对接维度模型呢？其实这个很好理解，因为维度模型当中我们存储的是什么？存储的是最明细的数据，因为我们的事实表都是最细力度。对最明细的数据，那你有了最明细的数据，那你后续是不是做任何这个力度的聚合我都能做呀，任何力度的聚合都能做，诶所以说咱们这样呢，对接最原始的数据，然后后续呢，做各种分析，好那现在咱们看看我们这边对接个什么数据啊，那也就是咱们对接的时候，对接星星模型或者水花模型，我们得有实时表，得有维度表，对吧？那看看咱们实时表有什么act。
04:17
那我们选一个实时表吧，咱们选一个谁呀？诶可以选一个支付吧，或者是咱们选一个，诶就选支付吧，咱们选一个支付实时表，Dwd fact payment in，咱们选它，那OK，选完之后点击这个snchronize，这时候它就会同步一张表，当然我们这儿呢，可以一起同多张表啊，你看啊，我点完之后这个可能不太明显啊，点完之后是不是变变成粗体了呀，变粗了，那就是选中了，点完之后我还有什么，我还有维度表呢，维度表咱是D啊，这是可以搜索的啊，这是搜索搜地M，那team里边咱们跟支付相关的是那个维度边有什么呀？跟支付相关的，诶有谁有用户。对不对，还有什么，还有这个，比如说还有时间，还有什么可能还有这个，呃，这个地区对不对，那这些都是我的这个，呃，维度表，那OK，我在这呢，我可以把它选上，那比如说我现在呢，选一个这个这个用户，先选一个用户啊，那用户我们是一个什么，是一个拉链表对不对？拉链表那咱们就选这个user in for history选它，那还有谁还有这个，比如还有日期，那把日期也选上，还有谁还有一个那个地区表，那把它也选上，那这样一来我们是不是就已经选上了几张表了，一共选上了呃四张表了，一张事实，三张维度，那选完这个模型之后呢，点击一下这个S同步点。
05:32
那这时候大家看这个位置是不是就出现了一个这个机帽啊，对吧，点完这里边呢，就有我们刚才选的那四张表了，大家这时候要注意啊，其实咱这儿现在倒过来的是什么，倒过来是真正的数据跑什么麒麟里边来了没有，我们只是拿到了这个害武的原数据，咱们只是拿到它的原数据啊，只是原数据，这原数据啊好，那拿到原数据之后呢，那接下来呃，我们就可以去这个去定义咱们的这个呃，这个模这个这个模型或者那个Q吧了啊那接下来咱们往下进行，往下进行。
06:05
那接下来咱们应该怎么做呢？接下来我们要做的一件事啊，是去咱们现在只是把表拿回来了，对不对，但是麒麟现在并不知道哪张表是事实表，他也不知道哪张是维度对不对，那他也不知道谁是那个维度字段，也不知道谁是这个，诶度量字段对吧，他不知道，那所以说我们现在要做的事就是需要把这个东西给他定义一下，好，那现在我们去声明一下，咱们这个这个实时表是谁，纬度表是谁。然后呢，还得指明咱们事实表跟维度表之间是通过哪个字段进行关联的，这个都得告诉麒麟才行，对吧，那现在咱们点一下这个大写的new。大绿色的new啊，New完之后呢，这里边你看有一个new model，这个model是不是就模型的意思，模型这指代的就是咱们什么星星模型，雪花模型这个东西，然后这边你看啊，是不是有个五角星，那意思就是这个星星模型嘛，当然雪花模型它也是支持的啊，点new model，然后这里边我们先起一个名字。
07:00
随便写就行啊，在这边比如说我叫payment star，就是这个星星模型嘛，下边有个描述信息，你这个随便写一下就行了，Pay详线T。好，写上这个描述信息之后呢，接下来呢，我们呃，这个位置呢，有一个有一个N啊，点一下next点。连完之后呢，那接下来呢，我们就来到了这个，呃，这一步，那这一步你看他让我们干什么，是不是，首先第一行让我们去选这个fact table啊，Fact是不是就是事实表的意思，对不对？那现在咱们点事实点谁是事实表，找找找这是实表，那选上它就行了，那下边呢，有一个lookup table lookup table是什么呢？是这个，呃，Lookup是查找的意思，对吧？那在这儿就是查找表，实际上是谁啊，实际上是维度表。因为我们维度表的作用是什么，维度表作用是不是用来去描述咱们这个事实的呀，对吧，也就是我这里边有ID，我拿着ID去维度表里边去查找我这个具体的信息，所也管它叫做查找表lookup table啊，那现在我们去把那个维度表都给它定义上来，先点它完之后呢，上面看这啊，首先这里边实际上就是在让我们去干什么，去去去声明一个join关系，对吧，就是哪张表join哪张表对吧？诶是这样的啊，那现在呢，我们去给他，诶选择一下，选择一下啊，那首先呢，我们来选这个事实。
08:18
点这个位置。这里边先看第一个吧，这呢有一个这个DWD，这个payment，你看啊，第一张表是不是只能选实，现在我因为只有实时表点它。完事这个join的时候呢，我们的join的方式呢，有in the，有left join，有inner join，有left join，那这边呢，我们最好是去使用这个left join啊呃，那使用left join我们有什么好处呢？就是说我们的好处就是说我，诶无论这个维度有没有我最起码我能把这个事实都给你返回出来。对不对，要不然的话，如果说你某一个维度没有，那你那行事实也给你丢了，这实际上是不太合理的，对不对，所以说我们通常使用left join啊，Left事实表，让他去left draw，咱们的这个维度表，维度表那OK，那这个咱们就给它呃照上了，那照上完之后呢，接下来咱们往下选啊，下边有一个这个这个呃，Lookup table对不对，Lookup table，那我们开始往下选，那这时候呢，咱们把这三张维度表呢，都需要给它选上啊，那先选第一个。
09:17
那学完之后这时候呢，呃还没完，你得告诉他呀，诶你这个表跟这个表你的join的连接条件是谁，怎么怎么加呢，下边有一个诶new这个join condition加连接条件连，然后呢，我们去把这个连接条件给他指明一下，那应该是什么呀，应该是事实表当中的，这咱们是哪张表，是用户维度表吧，那应该是右的ID，等于这个ID，那是就照上了呀，照上之后呢，点一下这个右下角的OK。点这儿啊。OK，好，那已经加上一张表了，那接下来呢，我们去呃，选下边的那个其他表啊，然后点lookup table，那我就快速的选了啊，然后这时候你看啊，这个from table，这时候你能选两个表了。能选两个表了，那能选事实表，那说明我是支持什么，支持星循环性，那我现在能选谁能选维度表。
10:06
能选维度表，说明我现在这个还支持什么模型，是不是也支持雪花模型啊，因为维度表也能在join其他的维度表，这是不是就是雪花模型啊，哎，它是支持的啊，那当然我们这是星星，那还是选实时表，那下边呢还是选left，下边呢还是选选谁呀。选下边咱们来一个这个呃，DWD这个这个base province这个地区表，那接下来呢，选这个连接条件来往下走，有这个往下走啊，找一下pro ID，然后这块呢有一个ID，那他们俩就这个上了，然后点击OK，好，那接下来呢往下走，下边呢再选还是选实时表啊，选它那inner还是选left吧，然后再往下我们该谁了，该这个date in for了，选它那加条件。那这回咱们data in for这个维度表跟我这个实时表照的时候，咱们照的条字段是谁呀，实际上就是咱那个分区字段，就是那个DT分区字段啊，用它去照，那照样这个data ID好，那点击OK，那这时候咱们是不是这个模型相当于就已经定义好了呀，就是咱们已经有实时表，已经有这个维度表了，好而且照样关系呢，咱们已经给他已经已经描述完毕了，描述完毕之后点击next。
11:18
点它。好，完了之后呢，我们看来到了哪一步啊，这一步呢，要求我们去声明哪些字段是维度，哪些字段是这个度量dimensions Mars，那现在我们去选一下这个维度啊，那维度是什么维度，就是说你后续你要观察的这个问题的角度对不对，比如说我就想分析一下这个，比如说支付金额跟什么什么的关系对不对，那这边你要要把这个给它选上，对吧，这是根据咱们的业务来的啊，那我后续呢，我们看看这里边可能有什么维度啊，先看这个第一个实时表当中的维度，那这里边我们看有没有这个可以分析的东西啊，看一看。那比如说我现在呢，想去分析一下，诶这边是不是有一个支付类型payment的type，我想看一看支付类型，诶跟这个支付的这个关系，就看看比如说我什么支付类型，诶我的这个支付的金额是最多的，对不对，可以看看这个东西啊好，那你这儿可以把它选上，那下边呢，在用户表里边，我看看有哪些我可以分析问题的维度，那比如说谁，诶比如说有一个性别，那性别咱是不是可以作为分析问题的维度啊，看看不同的性别我们的支付情况是什么样的，对吧？看看谁更败家一点对不对，到底是败败家这个还是败家那个，对吧，那咱们往点点。
12:26
连上这个针的，然后再往下呢，还有什么？呃，诶用户等级实际上也可以作为一个分析问题的这个角度，对不对？那就是说我看看不同等级的用户，我的这个，诶支付分布是什么样的，诶这也是可以的，那下边其他的东西呢，咱们就不要了，然后往下看，下边还有谁可以作为分析位来的维度呢？诶这个地区，那地区里边呢，我可能按照这个省份去进行这个分析，那pronce name还可可以按，还可以按照什么，按照region name就是地区，我看不同地区诶或者不同省份跟咱们这个支付的这个，诶关系是怎么样的？好，那接下来往下看，下边还有什么，还有这个，呃，Data in for data in for，那也就是这个，呃日期，那日期这边呢，我可能会统计什么呀，诶，我可能会统计，诶这个呃一个季度的对不对，也可能会统计这个一个月份了，对不对，你都可以，那你这边你随便选，比如说我选一个季度，那OK，那这个后期呢，你想去统计，你就呃可以按照这个东西去进行格外进行分组了。
13:23
好，那这个咱就先选这么多吧，选完之后呢，这边呢，我们还是有一个next，点击next点。完了之后呢，我们就来到了这个，呃，下一步就是这个去指定mirror mirror什么，就是那个度量值，度量值是什么啊，那咱们这个你看啊，刚才我们选dimension的时候，你会发现我是不是可以从事实表里选，也能从维度表里选对不对，但是选measure的时候，我们只能从哪儿选啊，只能从事实表里边选。对不对，只有一个实时表，那实时表当中，我们对于支付来说，它的那个度量值，它的事实应该是谁啊，应该是payment amount吧，支付金额，那咱们把这个金额拿回来就行了，嗯，好了，那这个拿完之后呢，我们剪辑N。
14:02
那再往后呢，大家来到了这个位置啊，看这个位置，这个位置让我们去干什么呢？这是这个settings设置，那这个位置让我干什么看一下。让我们去，诶声明这个partan分区分区啊分区，那这边是什么，大家可以想一想，我们这个，呃，麒麟它可以干什么，可以做离线计算，也能做实时计算，对不对，那我们现在用的干什么，我们用现在用的是干这个离线计算。呃，离身计算，那离线计算我们数仓当中是怎么样的，是不是数据我一天一天的过来，然后我一天一天的算啊，就是来一天的数据我算一下，来一天的数据我算一下，那同理麒麟它也是这么去使用的，就是我来一天数据，我算一天的数据来一天算一天，来一天算一天，诶这么个原理啊好，那既然是这样的话呢，我们来看一看，那所以说麒麟它去获取你一天这个数据的时候，它是不是得根据你那个分区字段去获取啊。对不对，他需要知道你的分区字段是谁，那这边呢，所以说诶，这需要我们指明我们是按照什么分区的，那这时候呢，咱们选一下啊，比如说我这呢，有一个select partition table，也就说选你的分区表，那这时候呢，我们实际上只能选择事实表。
15:10
只能选四表啊，那也就是现在选不了维度表对不对，咱选不了维度表啊，那选不了维度表后续可能会出什么问题，这时候大家可以想一想啊，可以先想一想，那我先不提这个事，咱们先学诗边，学完之后呢，那你的分区字段是谁谁like part column，那是不是下边那个DT啊，这是我们的分区字段，那下边呢，有一个这个我们的日期格式。Format日期格式是什么呢？诶是年月日，这是不是就是我们的日期格式啊YYYY杠杠杠MM-GD，这是我们的格式，当然这边它支持的格式比较多的啊，你看还有什么，诶可能有这个这样的，还有小时的分钟的秒的对不对，呃是这样，它能够支持各种各样的格式，那这边咱们就选它就对了，就没错了啊行，那这边咱们就诶完事了，然后下边呢，还有一个filter，然后这filter是这个过滤器，过滤器，然后大家往这里边写的时候呢，就是我们正常的这个VR过滤条件，VR过滤条件啊，然后大家这块要注意，这时候你这个通常我们这个其实也不用写，你要写的话呢，这块写这个它会对谁生效啊，注意只会对我们的事实表生效，对维度表没没用，也就咱们这个界面配置的东西全是对事实表的配置。
16:19
所以要注意啊，那这边咱们不用配，我们就一天数据全部都要拿过来计算，所以不用过滤，那OK，那完了之后呢，我们接下来点击最后边有一个save啊，点击保存。然后点击这个yes，好，那现在这个咱们的model就已经有了，在这个位置啊，这个model，那这个model呢，你可以这个编辑的啊，可以编辑编辑也可以删除，也可以克隆，诶是这样的啊好，Mole咱们就定义完毕了，定义完Mo之后呢，那紧接着我们接下来要去干什么呢？接下来我们要去定义cube了。也就model是在干什么，Model只是在去声明我的实时表跟维度表之间的关系，我并没有去定义我要计算哪些东西对不对，那真正的要计算哪些东西，在什么时候定义呢？再去你，诶你去构建cube的时候去定义的，所以接下来咱们还要去定定一个CU吧，啊好，我。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（170/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

330

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

246_尚硅谷_即席查询_Kylin_使用_定义model

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐