文章/答案/技术大牛

发布

首页视频254-尚硅谷-即席查询-Kylin基础架构

254-尚硅谷-即席查询-Kylin基础架构

2022-12-022022-12-02 16:02:24播放32

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V3.0/视频/254-尚硅谷-即席查询-Kylin基础架构.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们把这个PPT点开。嗯。啊，这是这个麒麟的一个架构图啊，这个架构图呢，就是呃，看着这个挺简单的对吧？啊，这个分层很明确对吧，但是这里边儿东西还是比较多，咱们一点一点解释啊来咱们先看呢，它分为的是几层啊，它大致呢，分为这样三层，下面这层计算层，上面这层呢叫做。什么层啊，查询层，计算层，查询层，然后呢，这个中间这叫啥叫做路由层啊，这个路由干什么用的，后续我再解释啊呃，咱们先看这个最基础两层，一个计算一个查询啊，那现在呢，我们先看计算吧，先看计算啊。计算里边呢，咱们分为这两层啊，一层呢叫做原数据，这个原数据呢，呃，它其实可以配置的啊，存在什么地方，你可以让它存在，呃，这个HP当中也可以让它存在哪存在这个关系数据库里都可以，可以配置，默认在HP当中啊啊，它这个原数据你先不用管它存哪啊啊咱们就记住啊，这个原数据指的是啥啊，指的就是谁呀，就是我们那些多维数据集的，也是那个olap cube的这个语言数据。
01:15
啊，比如说你的or q啊，你里边有哪些维度字段啊，你的度量值是什么，你聚合的函数是啥？这是不是有它那原数据信息啊，那这些哎，指的就是这个ma date啊，那这个咱们完了之后看下边，下边呢才是咱们那个真正的计算引擎啊，这个计算引擎呢，叫做cube build engine啊翻译过来就叫做cube构建引擎。啊，这个所谓的构建cube就是干啥呢？是不是就是把咱们的明细原始数据给你放到olap QB当中，OPQ当中，咱们也分析过了，就边存的是啥呀，是聚合之后的结果对不对，那所以说你构建cube的过程就是什么的过程。计算的过程啊，就是计算的过程啊，所以这块呢，咱们能搞明白就可以了。好，那既然你要计算了，计算你是不是得有原始数据，那计算完之后，你的cube是不是得存在一个地方，那你的原始数据来自哪儿，你的cub又存到哪儿呢？我们来看一下原始数据呢？我们可以对接的有这样的两个，一个呢是我们的have。
02:14
哪一个呢，是卡不卡，那如果说我们对接的是have的话，那你做的应该是什么计算，离线计算，那如果说你对接的是卡不卡呢？实指计算也是咱们麒麟的目前是既能支持这个离线计算，也能支持这个实时计算的啊有离线有实时，你要想做实时，那你就把你的实时数据对接到卡夫卡里边，然后呢，让麒麟去对接卡卡就行了，如果说你像做离线，做离线呢，我们直接对接have就可以了啊好，那咱们这儿呢，是离线，我们对接的就是have啊好，那完了之后呢，数据我从这个have当中拿过来，那结果计算完之后存哪去呢？存在h base当中。啊，你看现在的这个麒麟的数据呢，是存储到了h base里边啊，H base里边。
03:00
啊，这个大家呢，要注意一下啊，存到h base里啊，那麒麟在这儿呢，它为什么会选择h base呢，作为它的这个存储引擎呢，计算引擎，这个这个存储存储数据的引擎呢，为什么呀。啊，对，没错啊，首先大家得知道第一点。让你去选这个，诶这个麒麟的存储引擎的话呢，你需要考虑这样的两点啊，第一点啊，第一点是什么呀，因为我们麒麟它是要进行预计算的，那预计算呢，我需要把所有的结果穷举出来吧，对不对，那你说这个计算量，这个最终这个结果的这个数据量是不是也不小啊对不对，也不小，也很大啊，也很大，那所以说首先你得保证你的这个存储系统呢，它得能够进行很好的一个扩展才可以。对不对，因为我这个最终可能我这个随着我这个使用的时间的这个呃，增增长，那我这个结果级的数量会越来越大，对不对，所以说你得具有良好的扩展性，那h base是不是它去具备这种良好的扩展性啊，H base呢，我一张表，我可以进行不断的分裂，分裂成多个region，多个region呢，可以是不是横向的分，分布在我不同的R里边啊，对吧，而且它底层依托的是HDFS这个分布式存储系统，所以说这个诶扩展性肯定是没问题的。
04:13
好，那除了扩展性要强，那还得还得有一个点什么点啊。你查询的得快才行，对不对，因为我是集齐查询，我要求我从，因为咱们大家都知道啊，麒麟我是不是直接查结果呀，对不对，也就是说你结果存哪，你后续查的时候是不是从哪查呀，对不对，那我所以说呢，我我就还得考虑到我这个后续查询延迟得低啊，那h base它是不是就能够做到这个快速的查询呀，对不对，因为现在咱们给大家分析过，那我的h base呢，我会借助好多这个点去优化我的查询速度，比如说什么呀。比如啥呀啊，比如说最底层的存储，存储文件是不是HL啊，HL结构是不是有什么块有索引能够加速查询，我还有什么这个布隆过滤器对不对？呃，我还有啥呀，我还有什么这个block catch是不是能帮助我这个进行快速查询呀，而且我roll是有序的，是不是能够快速定位数据啊等等等等各各方面吧，麒麟呃，这个这个h base各方面吧，对它的这个查询速度进行了很大量的优化啊，所以说h base能够保证我的查询速度啊，所以最终呢，嗯，那h base呢，选做选选谁啊，选h base呢，作为了它的这个存储引擎啊，是这样的啊，也就是他那个所谓的olapq呢，就存储在了h base当中。
05:27
好，那这样一来呢，我们这个计算层基本上就明确了啊，那数据呢，从have当中来，那计算完之后呢，你看啊，这有一个什么，有一个star game date对吧，是不是星型模型的数据啊，当然雪花模型也支持，那对接这个模型的数据之后呢，我计算计算完之后呢，把结果存到了h base当中，那当然h base当中是KV建值对的形式对吧？啊就是建值对的形式，好，那这就是我们这个计算啊，就是这样的一套啊好，那接下来呢，我们再看上面这层，那上面这层呢，我们有两个啊，一个叫做rest server层，一个叫做啥呀。
06:01
Query engine查询引擎层啊，那这两层分别是干什么的啊？我们先说rest server层。Rest server呢，其实就是一个什么呀啊，就是我们的一个数据接口服务，相当于是啊，它它大致能够实现什么样的功能呢？其实昨天我不是给大家看了一下，呃，那个就是我写了一个小小那个呃，报表的一个小小项目，对吧？啊，那当时给大家演示了一下，我是不是访问了一下那个local的8080那个端口，然后后边它是不是加了一个地址啊，加了一个加一个什么，加了一个叉的，呃，加了一个派对吧，完之后是不是就给我响应了，响应的是什么形式啊。杰森对吧，还能想起来吧？啊，那我访问的那个东西，这就是一个rest的接口啊，就是一个rest风格的一个接口，就是相当于是一个你访问一个地址啊，然后呢，它给你响应具体的数据，然后数据呢，响应的格式呢，一般情况下就是接森啊，一般就是接森啊是这样的啊，也就是说它这样呢，相当于给我们暴了什么呀，是暴露了接口，我们可以访问这个接口，访问接口之后，他会给我们响应，那响应给我们的是啥呀？是杰森数据，是杰森数据啊当然呢，呃，麒麟呢，对这个这个响阳的街子呢，又做了进一步的封装啊，做了进一步的封装，那封装是什么呢呀，我们往上看。
07:15
啊，这个路遥层先不看啊，先看上边啊，那封成什么呢？哎，封装第一个，这是就是咱们那种普通的rest接口，你就直接请求，然后给你返回接子，那还有什么呀。哎，还提供了这个JDBC和odbc的接口，那JDBC大家应该都都都熟悉啊，都熟悉它是干啥的呀。是不是我们Java当中跟数据库进行交互的一个协议啊，对吧，那ODBC是干啥的呀，其实也是跟数据库进行交互的一个协议，那只不过这个呢，不是我们Java语言当中的，这是什么里边的呀，C语言当中的啊，C语当中的跟这个数据库进行交互的一个协议啊，啊是这样的啊，那当然呢，不管你采用什么方式去访问麒麟，那其实都会通过它的这个rest的接口啊，都会通过rest这个接口啊，都访问的是它访问就是这个rest的服务啊rest服务啊，那也就是说这个东西，那他到底是干啥的呢？其实就是干啥的呀，就是接受你的请求，然后干啥给你返回。
08:09
数据的响应对不对啊，就是干这个事的，干这个事的啊好，那这是它，那接下来咱们再往下看。下边这个query engine是干什么的啊，大家想想啊，你不管通过什么方式去访问麒麟，那你给他发送的所谓的请求里边肯定包含什么，肯定包含circle，因为使用频率是不是就是查询呀，对吧？那肯定有circle，那那这个run server呢，拿到这个circle之后呢，都干啥呀？会把这个circle呢传递给下面的这个查询引擎层，那查询引擎层它所负责的主要的工作就是啥？是不是就是解析你这套circleq，然后把SQL解析成啥呀？是不是解析成h base查询语言，因为我要去从你的h base当中查询结果吧，对不对，所以说你要把它查解析成h base查询语言。好，那解决完之后我去查询，查询完之后是不是会得到结果，那结果之后呢，我会怎么办，是不是通过这个rest server是不是在响应给你的客户端呀，对不对，其实干这个事儿了，就是把SQL转转化成或者解析成HP的查询语言啊好是这样的啊好，这就是查询层。
09:13
啊，那通过这样呢，其实大家能看到啊，咱们的麒麟给我们提供了丰富的接口啊，普通的rest API，那这个后续呢，我们会给大家演示啊，给大家演示一下到底什么叫做rest CPI，到底怎么用啊，其实很简单，就是访问一个地址就行了，就像我昨天那样，在我浏览器上面，我是不是访问一个请求，你就给我返回结果呀，啊，其实就是这个东西啊好，那这边往下走，那还有这个JBCODBC的接口，那有了这些东西，我们就能够和一些支持JDBC或ODBC协议的这个BI工具进行集成了，比如说我们昨天学的superide，他就支持GDBC，那他就能够跟我们的麒麟做一个很好的对接啊好，那再往下走。那到这儿呢，我们相当于完成了这个查询层的解释了啊，那接下来我们再看，诶再看哪，再看中间这个路由层啊，再看路由层啊，这个路由层它干什么用呢？其实呃，麒麟也很好理解啊，但现在先给我思考一个场景啊，什么场景大家说我们都知道啊，麒麟它底层的原理是预计算对不对，那预算呢，它会先把你所有的东西是不是给你穷举出来啊，但是他所能够穷举的仅仅是什么样的差询。
10:20
是不是那种多维分析的查询呀，对不对，它能穷举的是不是仅仅是那种按照维度计算分组，按照度量值聚合的那种计算，它是不是只能穷举那种，那如果说你在这儿呢，想做这种复杂的查询，你不是这种普通的这种分组聚合的查询啊，一些复杂查询，那你说麒麟能够帮你进行预计算吗？是不能的，因为你那个结果呢，可能是无穷无尽的，对不对，所以说这种呢，他不可能帮你去进行穷举的。啊，那所以说我们在使用麒麟的时候呢，假如说我在这儿呢，做一些，哎，没有进行预算的查询，那是不是你去h base当中查就查不到结果呀，没有啊，那所以说麒麟在边想的挺好，如果在HP当中查不到结果，那我就给你怎么样啊，我给你路由到have当中，那你从have当中原始数据里查，是不是肯定能查到结果，对不对，那当然他这想的好，但其实这个东西呢，不是那么的好用，为什么呢？啊，你想想，如果说我这个结果能从HP查压秒级响应，那如果说我去还有里边查。
11:22
那可能就几分钟，几十分钟，甚至几个小时，对不对，那所以说呢，这样一来会导致什么呀，会导致啊，我们这个麒麟的这个响应时间那不可预知，就是你也不知道它到底多长时间能给你响应了，对吧，你这是不知道了，那你如果说我要对接后边的系统，那你是不后边系统就不太好设计了呀，对不对，我到底是按照你压秒机响应设计啊，还是按照你一个小时响应去设计啊对不对，那所以说对后边的系统会有相应的影响，那现在呃，默认情况下呢，麒麟这个路由层呢，其实已经是关闭的了啊，默认就是关闭的不开启。啊，那它的现状是什么样的呢？现状就是来一个来一个circle啊，我能从h base里查，我就返回结果，我去h base查，查不到结果我就返回空，我也不会去，还有里边查了能理解吧，那通常咱们就这么去使用就行了。
12:10
好，那所以说我们大家在使用麒麟的时候呢，我们要注意这样的一个点啊，什么点，你去使用麒麟查询数据的时候呢，你只能查什么样的数据啊。是不是只能查你聚合好的数据啊，别的数据原始数据，明细数据，你比如说我贼来星麒麟，那你说能查出来吗。谁来星谁来星是不是就没有进行聚合，直接查明细数据啊，对吧，能查出来吗？你查不出来呀，对不对，因为你麒麟当中存的是聚合之后的结果啊，你查明细它是没有的啊，这个大家得搞清楚，这就是我们麒麟的这个架构啊啊，那这边我把视频录一下啊好。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V3.0

（251/291）

7分1秒

001-尚硅谷-数据仓库-课程介绍

390

19分57秒

002-尚硅谷-数据仓库-项目概述

350

15分4秒

003-尚硅谷-项目分析-需求分析

300

17分26秒

004-尚硅谷-项目分析-技术选型

420

11分48秒

005-尚硅谷-项目分析-数据流程设计图

370

13分25秒

006-尚硅谷-项目分析-框架版本选择

380

10分2秒

007-尚硅谷-项目分析-服务器选型

270

11分59秒

008-尚硅谷-项目分析-集群规模规划

370

20分1秒

009-尚硅谷-日志采集-埋点目标数据

560

9分50秒

010-尚硅谷-日志采集-主流埋点方式(了解)

460

12分31秒

011-尚硅谷-日志采集-日志数据结构

400

4分42秒

012-尚硅谷-日志采集-埋点数据上报时机

340

14分25秒

013-尚硅谷-日志采集-服务器准备

420

8分40秒

017-尚硅谷-日志采集-JDK配置及免密配置

370

1分48秒

018-尚硅谷-日志采集-JDK分发

370

7分30秒

019-尚硅谷-日志采集-Linux环境变量说明

420

10分24秒

020-尚硅谷-日志采集-模拟生成日志

380

7分37秒

021-尚硅谷-日志采集-模拟日志脚本

380

5分25秒

022-尚硅谷-日志采集-Hadoop部署之环境变量配置

340

19分0秒

023-尚硅谷-日志采集-Hadoop部署之核心配置

520

12分27秒

024-尚硅谷-日志采集-Hadoop部署之其余配置

370

2分43秒

025-尚硅谷-日志采集-Hadoop部署之历史服务器和日志聚集配置

390

4分23秒

026-尚硅谷-日志采集-Hadoop部署之启动及测试

470

9分17秒

027-尚硅谷-日志采集-Hadoop项目经验之多目录存储

360

8分27秒

028-尚硅谷-日志采集-Hadoop项目经验之数据均衡

300

7分30秒

029-尚硅谷-日志采集-Hadoop项目经验之LZO压缩配置

330

5分21秒

030-尚硅谷-日志采集-Hadoop项目经验之LZO压缩测试

380

9分0秒

031-尚硅谷-日志采集-Hadoop项目经验之LZO切片说明

340

8分39秒

032-尚硅谷-日志采集-Hadoop项目经验之参数调优

290

27分28秒

033-尚硅谷-日志采集-Hadoop项目经验之基准测试

360

7分39秒

034-尚硅谷-日志采集-通道设计规划

440

9分38秒

035-尚硅谷-日志采集-Zookeeper部署

270

10分52秒

036-尚硅谷-日志采集-Kafka安装

360

20分5秒

037-尚硅谷-日志采集-Kafka常用脚本

340

5分16秒

038-尚硅谷-日志采集-Kafka常用脚本补充

240

12分51秒

039-尚硅谷-日志采集-Kafka压力测试

330

9分17秒

040-尚硅谷-日志采集-Kafka机器数量与分区数量计算

430

4分31秒

041-尚硅谷-日志采集-Flume安装

400

5分21秒

042-尚硅谷-日志采集-日志采集配置方案对比

340

8分42秒

043-尚硅谷-日志采集-监控日志Flume组件选择

420

23分13秒

044-尚硅谷-日志采集-监控日志Flume配置文件

340

17分57秒

045-尚硅谷-日志采集-监控日志Flume拦截器编码

430

12分7秒

046-尚硅谷-日志采集-监控日志Flume测试

400

28分24秒

047-尚硅谷-日志采集-Flume启停脚本

360

10分31秒

048-尚硅谷-日志采集-消费KafkaFlume功能分析

340

2分18秒

049-尚硅谷-日志采集-消费KafkaFlume中KafkaChannel注意事项

420

37分35秒

050-尚硅谷-日志采集-消费KafkaFlume配置文件

380

9分2秒

051-尚硅谷-日志采集-消费KafkaFlume时间戳拦截器

440

9分26秒

052-尚硅谷-日志采集-消费KafkaFlume测试

390

1分21秒

053-尚硅谷-日志采集-消费KafkaFlume启停脚本

390

4分38秒

054-尚硅谷-日志采集-消费KafkaFlume内存调整

320

3分23秒

055-尚硅谷-日志采集-小结

310

12分12秒

056-尚硅谷-业务数据采集-电商系统概述

370

7分7秒

057-尚硅谷-业务数据采集-电商系统基本概念

340

7分44秒

058-尚硅谷-业务数据采集-电商系统表结构说明

370

25分1秒

059-尚硅谷-业务数据采集-电商系统核心表概述

340

15分55秒

060-尚硅谷-业务数据采集-电商系统表结构讲解

410

7分58秒

061-尚硅谷-业务数据采集-电商系统表字段说明

380

9分27秒

062-尚硅谷-业务数据采集-模拟数据生成之mysql部署

370

3分40秒

063-尚硅谷-业务数据采集-模拟数据生成之建表

350

10分23秒

064-尚硅谷-业务数据采集-模拟数据生成之EZDM使用简明介绍

410

9分39秒

065-尚硅谷-业务数据采集-模拟数据生成之测试

470

7分11秒

066-尚硅谷-业务数据采集-Sqoop概述

400

7分12秒

067-尚硅谷-业务数据采集-Sqoop安装

370

4分53秒

068-尚硅谷-业务数据采集-Sqoop测试

360

26分13秒

069-尚硅谷-业务数据采集-Sqoop基础使用

440

7分4秒

070-尚硅谷-业务数据采集-Sqoop使用之SQL形式导入

350

23分40秒

071-尚硅谷-业务数据采集-数据同步策略

340

14分33秒

072-尚硅谷-业务数据采集-业务数据表同步策略划分

360

40分18秒

073-尚硅谷-业务数据采集-Sqoop导入脚本之基础说明

310

7分33秒

074-尚硅谷-业务数据采集-Sqoop导入脚本之同步策略说明

450

2分40秒

075-尚硅谷-业务数据采集-Sqoop导入脚本之测试

350

1分35秒

076-尚硅谷-业务数据采集-Sqoop导入脚本之存在问题分析

380

3分57秒

077-尚硅谷-业务数据采集-Sqoop导入脚本之数据验证

420

34分16秒

078-尚硅谷-数仓建模理论-分层概述

440

5分48秒

079-尚硅谷-数仓建模理论-数据集市

300

7分43秒

080-尚硅谷-数仓建模理论-命名规范

390

17分1秒

081-尚硅谷-数仓建模理论-范式理论之概述

370

8分27秒

082-尚硅谷-数仓建模理论-范式理论之函数依赖

380

13分9秒

083-尚硅谷-数仓建模理论-范式理论之三范式

420

12分35秒

084-尚硅谷-数仓建模理论-OLTP与OLAP概述

420

18分6秒

085-尚硅谷-数仓建模理论-关系建模与维度建模

520

15分2秒

086-尚硅谷-数仓建模理论-维度模型之事实表与维度表

500

17分0秒

087-尚硅谷-数仓建模理论-维度模型之事实表分类

380

9分27秒

088-尚硅谷-数仓建模理论-维度模型之模型分类

490

13分41秒

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

380

4分33秒

090-尚硅谷-数仓建模理论-数仓分层模型之ODS层

380

26分1秒

091-尚硅谷-数仓建模理论-数仓分层模型之DWD层

310

30分51秒

092-尚硅谷-数仓建模理论-数仓分层模型之DWD层维度建模演示

400

11分2秒

093-尚硅谷-数仓建模理论-数仓分层模型之DWS层与DWT层

370

2分10秒

094-尚硅谷-数仓建模理论-数仓分层模型之建模驱动

430

10分34秒

095-尚硅谷-数仓环境准备-Hive安装

400

4分30秒

096-尚硅谷-数仓环境准备-Hive引擎说明

410

8分35秒

097-尚硅谷-数仓环境准备-框架兼容性问题说明

330

23分32秒

098-尚硅谷-数仓环境准备-HiveOnSpark配置

590

10分7秒

099-尚硅谷-数仓环境准备-HiveOnSpark测试

480

17分14秒

100-尚硅谷-数仓环境准备-Yarn容量调度器之并发度问题演示

400

19分38秒

101-尚硅谷-数仓环境准备-Yarn容量调度器之多队列配置

350

8分21秒

102-尚硅谷-数仓环境准备-Yarn容量调度器之提交任务指定队列

380

100

8分24秒

103-尚硅谷-数仓环境准备-DataGrip使用介绍

380

101

16分43秒

104-尚硅谷-数仓环境准备-新数据准备

350

102

11分4秒

105-尚硅谷-数仓搭建-ODS层日志表之建表语句

380

103

5分32秒

106-尚硅谷-数仓搭建-ODS层日志表之数据装载

360

104

7分58秒

107-尚硅谷-数仓搭建-ODS层日志表之装载脚本

330

105

4分33秒

108-尚硅谷-数仓搭建-扩展之Shell脚本引号总结

370

106

6分18秒

109-尚硅谷-数仓搭建-ODS层业务表之建表语句

340

107

4分28秒

110-尚硅谷-数仓搭建-ODS层业务表之装载脚本

420

108

8分8秒

111-尚硅谷-数仓搭建-DWD层日志表之数据结构回顾

400

109

7分34秒

112-尚硅谷-数仓搭建-DWD层日志表之Hive解析JSON函数说明

450

110

6分3秒

113-尚硅谷-数仓搭建-DWD层日志表之日志解析思路分析

340

111

7分26秒

114-尚硅谷-数仓搭建-DWD层日志表之启动表建表语句

330

112

9分0秒

115-尚硅谷-数仓搭建-DWD层日志表之启动表数据装载

360

113

4分28秒

116-尚硅谷-数仓搭建-DWD层日志表之页面表

380

114

9分14秒

117-尚硅谷-数仓搭建-DWD层日志表之动作表解析思路

360

115

5分42秒

118-尚硅谷-数仓搭建-回顾之explode函数使用说明

340

116

3分16秒

119-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数设计

270

117

11分16秒

120-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数说明

420

118

27分6秒

121-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(一)

380

119

8分49秒

122-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(二)

390

120

3分38秒

123-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数注意事项

300

121

6分10秒

124-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数创建

360

122

8分6秒

125-尚硅谷-数仓搭建-DWD层日志表之动作表数据装载

420

123

4分47秒

126-尚硅谷-数仓搭建-DWD层日志表之曝光表

450

124

9分8秒

127-尚硅谷-数仓搭建-DWD层日志表之错误表

400

125

9分57秒

128-尚硅谷-数仓搭建-DWD层数据装载之lzo索引文件识别问题

340

126

5分46秒

129-尚硅谷-数仓搭建-DWD层日志表之数据装载脚本

370

127

4分54秒

130-尚硅谷-数仓搭建-DWD层业务表之维度模型概述

340

128

11分5秒

131-尚硅谷-数仓搭建-DWD层业务表之商品维度表

330

129

1分50秒

132-尚硅谷-数仓搭建-DWD层业务表之优惠券维度表

430

130

11分44秒

133-尚硅谷-数仓搭建-DWD层业务表之活动维度表

350

131

3分40秒

134-尚硅谷-数仓搭建-DWD层业务表之地区维度表

450

132

16分34秒

135-尚硅谷-数仓搭建-DWD层业务表之时间维度表

340

133

19分22秒

136-尚硅谷-数仓搭建-DWD层业务表之支付事实表

380

134

7分22秒

137-尚硅谷-数仓搭建-DWD层业务表之退款事实表

300

135

9分45秒

138-尚硅谷-数仓搭建-DWD层业务表之评价事实表

390

136

7分8秒

139-尚硅谷-数仓搭建-DWD层业务表之订单明细实表建表语句

380

137

14分1秒

140-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(一)

310

138

9分26秒

141-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(二)

300

139

10分46秒

142-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(三)

290

140

7分56秒

143-尚硅谷-数仓搭建-DWD层业务表之加购与收藏事实表

390

141

10分16秒

144-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分析

390

142

7分48秒

145-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分区规划

380

143

9分35秒

146-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载思路

320

144

16分4秒

147-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载

330

145

9分53秒

148-尚硅谷-数仓搭建-DWD层业务表之订单事实表建表语句

430

146

43分22秒

149-尚硅谷-数仓搭建-DWD层业务表之订单事实表数据装载

340

147

17分10秒

150-尚硅谷-数仓搭建-DWD层业务表之拉链表概述

330

148

15分19秒

151-尚硅谷-数仓搭建-DWD层业务表之拉链表制作过程概述

350

149

17分40秒

152-尚硅谷-数仓搭建-DWD层业务表之用户维度表(一)

400

150

19分44秒

153-尚硅谷-数仓搭建-DWD层业务表之用户维度表(二)

390

151

8分10秒

154-尚硅谷-数仓搭建-DWD层业务表之数据装载脚本

340

152

28分38秒

155-尚硅谷-数仓搭建-DWS&DWT层之业务术语

360

153

14分11秒

156-尚硅谷-数仓搭建-DWS&DWT层之日期函数

380

154

7分22秒

157-尚硅谷-数仓搭建-DWS&DWT层之复杂数据类型使用说明

330

155

16分3秒

158-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表建表语句

400

156

47分40秒

159-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表数据装载

270

157

24分16秒

160-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表建表语句

310

158

6分37秒

161-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载思路分析

390

159

14分46秒

162-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(一)

390

160

29分43秒

163-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(二)

360

161

5分43秒

164-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表建表语句

330

162

13分7秒

165-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表数据装载

370

163

6分35秒

166-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表建表语句

340

164

13分45秒

167-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表初次装载说明

390

165

9分28秒

168-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表数据装载

480

166

1分20秒

169-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表建表语句

370

167

23分6秒

170-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(一)

390

168

24分27秒

171-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

430

169

9分25秒

172-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

320

170

12分3秒

173-尚硅谷-数仓搭建-DWT层之商品主题累积汇总表

400

171

20分48秒

174-尚硅谷-数仓搭建-DWS&DWT层之活动主题汇总表

430

172

16分29秒

175-尚硅谷-数仓搭建-DWS&DWT层之地区主题汇总表

430

173

7分5秒

176-尚硅谷-数仓搭建-DWS&DWT层之数据装载脚本

401

174

45分43秒

177-尚硅谷-数仓需求-设备主题之活跃设备数

350

175

4分36秒

178-尚硅谷-数仓需求-设备主题之新增&沉默&流失需求说明

330

176

6分13秒

179-尚硅谷-数仓需求-设备主题之新增设备数需求讲解

260

177

4分9秒

180-尚硅谷-数仓需求-设备主题之沉默用户数需求讲解

380

178

2分51秒

181-尚硅谷-数仓需求-设备主题之流失用户数需求讲解

370

179

8分5秒

182-尚硅谷-数仓需求-设备主题之留存率需求说明

430

180

2分2秒

183-尚硅谷-数仓需求-设备主题之回流用户数需求说明(一)

430

181

2分9秒

184-尚硅谷-数仓需求-设备主题之回流用户数需求说明(二)

400

182

1分57秒

185-尚硅谷-数仓需求-设备主题之最近三周连续活跃用户数需求说明

390

183

2分15秒

186-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求说明

360

184

16分33秒

187-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路一)

420

185

8分26秒

188-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路二)

330

186

14分24秒

189-尚硅谷-数仓需求-设备主题之回流用户数需求讲解

370

187

21分0秒

190-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路一)

410

188

9分28秒

191-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路二)

410

189

20分19秒

192-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路一)

350

190

13分4秒

193-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路二)

330

191

4分44秒

194-尚硅谷-数仓需求-会员主题之会员信息统计需求说明

370

192

5分15秒

195-尚硅谷-数仓需求-会员主题之漏斗分析需求说明

390

193

1分51秒

196-尚硅谷-数仓需求-商品主题之商品个数需求说明

340

194

10分1秒

197-尚硅谷-数仓需求-会员主题之会员信息统计需求讲解

330

195

21分8秒

198-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路一)

370

196

6分16秒

199-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路二)

270

197

5分51秒

200-尚硅谷-数仓需求-商品主题之商品个数需求讲解

310

198

8分5秒

201-尚硅谷-数仓需求-商品主题之全局TopN需求说明

380

199

2分45秒

202-尚硅谷-数仓需求-商品主题之分组TopN需求说明

390

200

4分28秒

203-尚硅谷-数仓需求-商品主题之销量排行需求讲解

330

201

3分21秒

204-尚硅谷-数仓需求-商品主题之退款率排行需求讲解

390

202

2分44秒

205-尚硅谷-数仓需求-商品主题之差评率排行需求讲解

360

203

10分57秒

206-尚硅谷-数仓需求-商品主题之分组TopN需求讲解

330

204

7分32秒

207-尚硅谷-数仓需求-营销主题之下单&支付统计需求说明

350

205

9分14秒

208-尚硅谷-数仓需求-营销主题之品怕复购率需求说明

380

206

3分44秒

209-尚硅谷-数仓需求-营销主题之下单统计需求讲解

370

207

11分45秒

210-尚硅谷-数仓需求-营销主题之支付统计需求讲解

350

208

16分54秒

211-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路一)

370

209

9分18秒

212-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路二)

460

210

7分48秒

213-尚硅谷-数仓需求-ADS层数据导入脚本

400

211

14分47秒

214-尚硅谷-全流程调度-工作流程概述

360

212

11分26秒

215-尚硅谷-全流程调度-调度系统概述

400

213

7分54秒

216-尚硅谷-全流程调度-Azkaban部署模式概述

380

214

2分57秒

217-尚硅谷-全流程调度-Azkaban安装之安装包准备

380

215

5分53秒

218-尚硅谷-全流程调度-Azkaban安装之数据库准备

340

216

11分25秒

219-尚硅谷-全流程调度-Azkaban安装之Exec部署

400

217

10分6秒

220-尚硅谷-全流程调度-Azkaban安装之Web部署

470

218

7分53秒

221-尚硅谷-全流程调度-Azkaban使用之入门案例

350

219

5分30秒

222-尚硅谷-全流程调度-Azkaban使用之工作流程配置文件说明

390

220

11分22秒

223-尚硅谷-全流程调度-Azkaban使用之Yaml文件格式概述

390

221

6分34秒

224-尚硅谷-全流程调度-Azkaban使用之任务依赖配置

420

222

4分23秒

225-尚硅谷-全流程调度-Azkaban使用之自动失败重试

380

223

3分56秒

226-尚硅谷-全流程调度-Azkaban使用之手动失败重试

390

224

6分57秒

227-尚硅谷-全流程调度-Azkaban使用之定时调度

410

225

9分35秒

228-尚硅谷-全流程调度-Azkaban使用之邮件配置

470

226

4分35秒

229-尚硅谷-全流程调度-Azkaban使用之邮件通知演示

310

227

5分14秒

230-尚硅谷-全流程调度-实操之Sqoop导出功能说明

440

228

15分3秒

231-尚硅谷-全流程调度-实操之MySQL建库建表

330

229

28分36秒

232-尚硅谷-全流程调度-实操之Sqoop导出脚本

380

230

6分58秒

233-尚硅谷-全流程调度-实操之新数据准备

360

231

7分13秒

234-尚硅谷-全流程调度-实操之Azkaban启停脚本

370

232

11分9秒

235-尚硅谷-全流程调度-实操之Azkaban工作流程配置文件编写

360

233

5分22秒

236-尚硅谷-全流程调度-实操之Azkaban工作流传参说明

440

234

9分34秒

237-尚硅谷-全流程调度-实操之Azkaban全流程调度演示

360

235

8分16秒

238-尚硅谷-全流程调度-实操之Azkaban问题总结

360

236

4分45秒

239-尚硅谷-数据可视化-概述

450

237

6分22秒

240-尚硅谷-数据可视化-Superset概述

370

238

15分56秒

241-尚硅谷-数据可视化-Superset安装之Miniconda部署

520

239

9分43秒

242-尚硅谷-数据可视化-Superset安装之准备Python3.6环境

430

240

7分2秒

243-尚硅谷-数据可视化-Superset安装

530

241

5分31秒

244-尚硅谷-数据可视化-Superset安装之初始化

490

242

6分20秒

245-尚硅谷-数据可视化-Superset安装之启动

400

243

9分52秒

246-尚硅谷-数据可视化-Superset安装之启停脚本

380

244

12分40秒

247-尚硅谷-数据可视化-Superset使用之对接数据源

450

245

13分39秒

248-尚硅谷-数据可视化-Superset使用之趋势图示例

780

246

7分29秒

249-尚硅谷-数据可视化-Superset使用之地图与饼状图示例

980

247

5分17秒

250-尚硅谷-数据可视化-Superset使用之编辑仪表盘

540

248

4分46秒

251-尚硅谷-即席查询-概述

370

249

4分42秒

252-尚硅谷-即席查询-Kylin概述

370

250

38分9秒

253-尚硅谷-即席查询-Kylin前置概念

310

251

12分46秒

254-尚硅谷-即席查询-Kylin基础架构

320

252

6分35秒

255-尚硅谷-即席查询-Kylin特点

310

253

14分12秒

256-尚硅谷-即席查询-Kylin安装之HBase部署

340

254

2分30秒

257-尚硅谷-即席查询-Kylin安装之环境变量准备

380

255

13分19秒

258-尚硅谷-即席查询-Kylin安装之兼容性问题说明

380

256

4分15秒

259-尚硅谷-即席查询-Kylin启动

440

257

30分54秒

260-尚硅谷-即席查询-Kylin使用之基础用法

360

258

21分49秒

261-尚硅谷-即席查询-Kylin使用之维度表重复key问题说明

380

259

8分29秒

262-尚硅谷-即席查询-Kylin使用之查询

390

260

12分39秒

263-尚硅谷-即席查询-Kylin使用之RestAPI使用概述

260

261

9分21秒

264-尚硅谷-即席查询-Kylin使用之每日定时构建脚本

440

262

6分42秒

265-尚硅谷-即席查询-Kylin原理之基础概念回顾

330

263

8分21秒

266-尚硅谷-即席查询-Kylin原理之Cube存储原理

480

264

15分2秒

267-尚硅谷-即席查询-Kylin原理之Cube构建原理

320

265

18分0秒

268-尚硅谷-即席查询-Kylin优化之衍生维度

400

266

13分24秒

269-尚硅谷-即席查询-Kylin优化之聚合组

340

267

15分23秒

270-尚硅谷-即席查询-Kylin优化之Rowkey调整

330

268

8分51秒

271-尚硅谷-即席查询-Kylin优化之并发粒度优化

370

269

7分13秒

272-尚硅谷-即席查询-KylinBI集成之JDBC

390

270

11分47秒

273-尚硅谷-即席查询-KylinBI集成之Zeppelin

390

271

25分6秒

274-尚硅谷-即席查询-Presto概述

340

272

23分45秒

275-尚硅谷-即席查询-Presto安装之Server部署

370

273

5分56秒

276-尚硅谷-即席查询-Presto安装之命令行客户端部署

340

274

8分54秒

277-尚硅谷-即席查询-Presto安装之LZO 压缩格式说明

320

275

8分14秒

278-尚硅谷-即席查询-Presto安装之可视化客户端部署

440

276

17分31秒

279-尚硅谷-即席查询-Presto使用注意事项

390

277

13分49秒

280-尚硅谷-集群监控-Zabbix概述

460

278

7分45秒

281-尚硅谷-集群监控-Zabbix安装之服务器环境准备

310

279

12分29秒

282-尚硅谷-集群监控-Zabbix安装之yum仓库配置

350

280

2分8秒

283-尚硅谷-集群监控-Zabbix安装之下载安装

380

281

10分9秒

284-尚硅谷-集群监控-Zabbix安装之修改配置文件

310

282

2分21秒

285-尚硅谷-集群监控-Zabbix启动

330

283

3分37秒

286-尚硅谷-集群监控-Zabbix安装之web配置

320

284

5分3秒

287-尚硅谷-集群监控-Zabbix使用之术语

400

285

7分17秒

288-尚硅谷-集群监控-Zabbix使用之创建主机

360

286

13分43秒

289-尚硅谷-集群监控-Zabbix使用之配置监控项

330

287

6分13秒

290-尚硅谷-集群监控-Zabbix使用之配置触发器

350

288

3分18秒

291-尚硅谷-集群监控-Zabbix使用之配置报警媒介

380

289

7分56秒

292-尚硅谷-集群监控-Zabbix使用之配置动作

320

290

2分12秒

293-尚硅谷-集群监控-Zabbix使用之测试

430

291

12分59秒

294-尚硅谷-集群监控-Zabbix使用之模板

390

254-尚硅谷-即席查询-Kylin基础架构

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐