文章/答案/技术大牛

发布

首页视频239_尚硅谷_即席查询_Kylin_架构_特点

239_尚硅谷_即席查询_Kylin_架构_特点

2022-12-022022-12-02 16:02:23播放36

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/239_尚硅谷_即席查询_Kylin_架构_特点.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
OK，那我们来打开这个麒麟文档上的这个架构的APP，咱们打开。啊，这个图呢，呃，实际上是从这个官网上拿下来的啊，是从官网上下来的，那这个只不过给他翻译成中文了，好，我们看这个麒麟架构啊，麒麟架构呢，大致呢，可以分为这样的三层，三层啊前面上面一层这是负责干什么的呢？负责查询的。负责查询的啊，那下边一层负责干什么呢？是负责这个计算的，负责计算的中间还有一个所谓的路由层，这个路由层呢，我们一会再单独说它，单独说它现在不考虑它，我们现在呢，一个是查询，一个是计算，对不对，那这个呃计算，我们先说计算吧，因为大家都知道我们麒麟要进行预计算，对不对，那预计算是在干什么呀？预计算是不是就在将原始的数据。给他干什么？给他是不是给他放到一个所谓的cube当中啊。对不对，就是给它进行这个o lap cube的这种构建，对不对，构建完之后这个cube呢，我是不是要进行存储的呀，对不对，那接下来我就得考虑了，你计算的数据源是什么，那你结果这个Q吧，存到什么地方了，这是应该是咱们考虑的东西啊，来我们来看一下这个，呃，计算层有什么东西啊。
01:14
层首先下边有一个引擎，Cube的N是不是就是呃，Cube构建引擎啊，对不对，这个所谓的cube构建事事实就是在干什么，事实上就是在原将原始数据给它进行聚合计算。对不对，这就是在构建Q嘛，其实就是说白了就是计算，就是计算引擎，对不对，那这边还有一个这个语言数据，这个语言数据指的是什么呢？就是我们后期啊，咱们这个呃，使用麒麟的时候呢，我可能会构建各种各样的cube，可能会有很多cube，那每个cube呀，都有一个自己的原数据的原数据啊，包括你这个里边啊，有什么维度对不对，有什么度量值对吧，那都是这个原数据要负责呃存储的东西。好，那这个咱们简单分析完了，接下来咱们看看我这个所谓的计算，我的诶数据源是什么，我的这个最终Q吧，存到什么地方，咱们来看看啊好。
02:05
先来看这个数据源，数据源呢，咱们麒麟我们能够对接什么，能够对接，也能够对接卡夫卡。那对接have的时候呢，我们麒麟用它干什么呀？是不是用来进行离线计算啊，对不对，那麒麟实际上也能对接卡夫卡，那对接卡夫卡就说明麒麟具有什么样的功能啊，是不是也具有这个实时计算的功能啊。是这样的，我们麒麟呢，也是能够进行实时计算的，对接卡不卡好，那在这个离线数仓当中呢，我们就让他去对接hi物就可以了，那对接hive对接的时候，我们对接的是什么呢？对接是这个星型模型，刚才咱们说了对不对，要对接咱们DWD层就可以了。好，那它完了之后呢，我们往下看，下边呢，就是说诶看这个位置。那这个位置下边就该什么呢？计算完之后你要干什么，你要把数据你要存储啊，对不对，你那个olapq是不是要进行存储，那存储我存储到什么地方呢。存储到h base当中，这是麒麟人家选择的这个咱们的呃，Cube的存储，存储的这个框架它使用的是h base，那其实大家可以分析分析啊，那麒麟它为什么会选用咱们的h base去存储这个ola cube呢？
03:18
为什么呢？为什么要选用h base，那他为什么选用HP，我是不是就得想一想h base它的特点是什么呀？H base特点是什么？H base它的特点就是我能够在怎么做，能够快速的怎么做呀，而且是随机的去干什么，去读写海量数据吧。对不对，那HB的特点就是实时的注意啊，是实时的随机的读写海量数据，那这个海量它海到什么程度呢？在HS官网上有明确的介绍，它能够支持什么呀，能够支持数百万行，呃，数百万列，然后数十亿行这样的大表。
04:01
第二大表，我们在h h base能能支持这么大的表啊，而且能够做到实时的随机读写，这是非常非常这个强大的啊，非常强大的，所以说咱们这边麒麟就最终采用了这个HV作为它的这个存储来源，为什么你想想啊，首先咱们刚才分析过了，我这个计算的时候啊，我因为要涉及到了，呃，是不是要计算很多这个维度组合呀，对不对，所以说首先我最终这个Q吧，要占用的空间会比较大。空间会比较大啊，那空间大，你咱们HS能够进行它是不是一个no circle啊，No circle它的特点就是能够干什么，能够进行这个无线的这个横向扩展，是非常容易进行横向扩展的，那所以说咱们这个数据量大，对h base来说不叫个事，而且数据量少，数据量小啊，我还不用h base呢，对不对，是不是只有数据量很大的时候，我才会用到h base，这个你得知道啊，你得知道这是第一点，那其次呢，那咱们麒麟，麒麟还还有一个什么特点，是不是我后续我得保证我查的时候快才行啊。
05:00
对不对，因为我是一个什么，我是一个及其查询框架嘛，Op及其查询框架，那你得快才行，那HP是不是能够进行随机的实时读写呀，那所以我读的肯定是比较快的，那所以说最终HP的成为了这个阿尔法奇这个存储olapq的这个选择啊，啊，这是他选它的原因，好了，那完事之后呢，我们再来看看这个下边这点这个东西啊，来看一下。啊，这个出来晚了，应该先出来这什么，这是对接的我们have当中的这个星型模型吧，Star game星型模型啊后边呢，这个最终的这个数据呢，我们存储到了这个HP当中，好，这就是咱们的计算层，就是这么多对接have和卡夫卡，然后数据计算完之后放到HP里，好那完事之后呢，我们再来看一看咱们这个上边的查询层，查询层呢，它给我们提供了这样的，呃，两层，有这样的两层，一层呢是这个query engine。Query engine什么意思，就是查询引擎呗，对吧，那上面呢，还有一个这个rest server，一个rest服务层，服务层，那这两层分别是用来干什么的呢？我们先来说一下这个query engine，就是这个呃，查询引擎，它的作用很明显，作用就是将我们客户端，也就是我们发过来的SQL请求给你转化成什么呀，是不是得转化成这个h base的这个查询语言啊。
06:21
对不对，因为咱们结果存哪了，存到诶h base里了，对不对，那你这个我们使用麒麟的时候，我麒麟给我们提供了circleql接口了，对不对，我们写circleql，写circleq，但是你这个能直接跑到h base里去查吗？不能，H base是没有这个circle的，对不对，那所以说它是它不是它不是关性数据库吗？对不，它是in no circle，那所以说麒麟这边能够将我们circle呢，转换成自己的这个h base产品语言，然后呢，从h base里边是不是能够直接返回我们想要的结果，那结果返回给客户端，那我们这边呢，就能够拿到我们想要的数据了。哎，其实这样的一个过程，是这样的一个过程啊好，那这个这个query engine我们就说完了，那说完之后呢，嗯，那上边是一层什么是一个这个rest服务层，诶一个服务层，那它的作用是什么呢？它的作用啊就是诶给我们客户端提供接口，给我们也是给我们提供接口，那因为什么？因为我们是不能直接去访问他这个，呃查询引擎的，我们只能通过谁只能通过rest server，它的作用就是提供接口，然后接收咱们客户端的请求，那请求拿回来之后，他再把请求转给这个query engine，然后呢，诶我们这边数据再返回。
07:30
是这样的一个逻辑啊，那这个server它都给我们提供了哪些接口呢？我们来看一看。上边有这样的。两个，一个是rest API，这个所谓的rest API呢，也就是说这个server呢，它给我们暴露了一个这样的一个接口，比如说这个麒麟下边的，呃，那个比如说呃，API下边有一个什么query，那OK，你访问这个接口的时候，那你就可以去进行查询。诶是这样的，当然还有各种各样的这个接口，各种各样的接口啊，那这个rest API呢，我们后续呃会去使用一下的，我会告诉大家怎么去使用这个rest API的啊，那如果说他给我们提供了rest API之后，我们能用它干什么呢？我们其实如果说有了这个rest API之后呢，我们可以怎么样，我们可以诶对它对这个麒麟进行二次开发，二次开发，那比如说我想自己开发一个麒麟的工作界面，一个外部页面，你自己是能开发的，为什么？因为它有rest的BI。
08:26
对不对，那你在你的前端，诶你你比如说有什么输入框啊等等等等，诶发送请求给后端，那我后端请求的是谁？后端我就请求咱们麒麟的这个rest so，那得到结果再去前端展示，诶是这样的啊，就是你可以进行二次开发，二次开发这是这一点，那除了rest API这种接口呢，还有什么接口呢？还有这个借力BC或者是ODBC的接口，那接力BC大家都都比较熟悉，是不是干什么呀？我们Java去连接数据库的这样的一个接口，对不对，那还有ODBCODBC是什么呢？区别就是这个是Java语言，那这边呢，我们是C语言，C语言，那也就是说咱们提供了接DBC或ODBC的接口，那有了这个我们就有什么好处了呢？呃，我们就可以非常方便的去和咱们这个BI工具去进行对接了。
09:11
BI工具大家现在应该都知道是啥了吧，就是咱们那种，诶像咱们今天上午是不是学了一个super set呀，对不对，那就是一个非常典型的BI工具，它的特点是什么？能够对接各种数据源，然后诶能够帮咱们把数据呢，以图形化的方式展示出来，这个BI分析工具对不对，那这个麒麟他有了这些接口之后呢，就能够非常方便的去和这些BI工具对接的，其实咱们superet呢，是能够跟麒麟进行对接的，是可以对接的啊好，那这个就是呃，麒麟给我们提供的这个查询接口。有这种API，还有这个GDPC好，但是你甭管使用哪种方式去访问这个，呃，麒麟甭管用哪种方式，你给他传的都应该有什么，都应该是circle。对不对，把所有给他，然后他给你返回结果，这就是咱们麒麟的这个主要的两层啊，一层是计算，一层是查询，那中间还有一层这个路由层，路由层是什么呢？我们简单的给大家分析一下啊。
10:06
是这样的，我们来分析一下，分析下什么事呢？大家琢磨琢磨，呃，咱们这个这个麒麟呢，我们麒麟它是一个什么引擎，刚才在官网上，包括这个文档上有定义是一个什么引擎，是一个多维分析o lap分析引擎。对不对，那o lap实际上指的什么是多维分析对不对，那多维分析其实呃，落实到我们的这个circle上面啊，落实到circleq上面，其实就是什么，其实说白了就是诶各种格入外，然后加聚合函数，是不是应该就是这类的查询，我们叫做多维分析啊，对不对，那也就说咱们麒麟呢，实际上对这个S的这个呃支持呢，就是说诶就支持这样的多维分析。支持这样的多维分析啊，只能是进行这样的多维分析，多维分析，那OK，那所以说是不是有一些可能有一些复杂的circle，或者一些复杂的这个函数，我们在麒麟当中是不支持的，对不对啊，那既然是这样的话，你想一想我们这个circlel，如果说我甭管什么样的circle我都扔给麒麟的，那这样一来会会有什么样的现象呢？我可能去HP里查呀，你并没有把我这个预计这个结果给给我预计算出来，你并没有预计算出来。
11:12
对不对，因为它能计算的值是什么，只是各种维度的组合对不对，再加上各种具有函数对不对，它只能把这样的给你计算出来，那像以其他的一些这个复杂的指标，我可能什么呀，我麒麟我是没有办法去进行穷举的，没有办法穷举，那所以说就会出现什么样的问题呢？诶我在麒麟里查的时候呢，可能有些指标我并没有进行预计算，那你去HP里查，你就查不出来，你就没有东西。对不对，没有东西，我们麒麟这边他他想了一个这样的办法啊，诶我加一个路由层，你h base当中没有OK，我把你这个so，我就给你转回你的have当中，你用谁呀，你去你用你用have去计算。对不对，那have是不是肯定什么样的需求我都能查出来呀，因为我有原始数据嘛，都能查出来，对吧，那确实这样能够解决这个问题，但这个这个层，这个路由层呢，但其实想的还是比较好的，但其实不好用，它为什么不好用呢？你想一想啊，咱们去设计一个系统的时候，比如说我要用到麒麟，我我设计一个系统要去用麒麟，那你想一想，那你是不是就得诶就得就得按照什么呀，就得诶我我就得认为我们的麒麟呢，是不是二秒级响应啊，那我设计系统的时候，我是不是都是按照秒级响应的这种这种这种规格去设计的这个咱们的系统啊。
12:22
对不对，那如果说咱们这个有这个路由层，那它是不是有些需求，他可能会给我转到那个have里边去查，那当然会导致什么呢？会导致啊，咱们后边这个系统，我这个查询时间不可预知。就不可预知，就是我可能我是按照什么呀，我是按照这个亚秒级想象去设计的，结果有些查询呢，你给我整了一个什么，整了一个一小时才回来，那所以导致这个系统呢，可能会诶出现这个问题啊，所以其实这个路由层呢，并不好用，那也就是现在呢，这个路由层就是默认其实是关闭的，默认是关闭的啊对默认已经是关闭的了，所以就现在啊，这个东西咱们就诶了解一下就行，有这么个东西就行，诶那咱们就不说它了啊，就不说它了，好了，那咱们这个就说完了啊好，那说完之后下边啊呃，还有一些这个文字介绍，就是对上面咱们这个每个组件的文字介绍，这个咱们就不再重复了，全是刚才我讲的东西啊。
13:12
好了，那这边就过了，过了之后我们再还有一点再讲一点吧，咱们把这个麒麟的特点呢，呃，也给大家说一下，也说一下啊，那麒麟的特点我们来看看啊。有这样的几个特点，一共这样的五个特点，呃，标准色后接口，支持超大数据集压秒级响应，可伸缩性，高存储率，BI功集成，这是它的特点，这其实也是官网上的东西啊，也是官网上的，那我们来看看第一点啊，标准的SQ接口，那有的东西可能会比较诧异啊，你不就有一个SQ接口吗？这有什么值得提的，这还作为一个特点对不对，这还还值得作一个特点，那就是为什么？其实它确实值得作为一个特点，为什么啊，你得想一下咱们的麒麟它是一个什么olap分析引擎啊。它是一个Mo LA，它不是Mo lap对不对，那你要是mop，那你有S那是很正常的，但是你对于一个mop来说，我是基于作为数据集的，对不对，那实际上我正常是没有这个SQL接口的。
14:10
但是我们麒麟呢，恰恰就在mop的基础之上，给我们提供了四个接口，所以说这个东西呢，它就值得一提了，是这么回事啊，好了，那接下来往下看，原来是支持这个超大数据集，那这个东西跟这俩跟这个样本响应的，我们应该组合起来去看对不对，就是我数据量可以很大很大，然后呢，下边我这个查的时候呢，我的速度还是很快的，亚马逊响应。是这样的啊，这就是呃，咱们这个麒麟的这个最重要的特点，性能非常非常好啊。就是在现有的这个市面上啊，就是呃，就是说现有的市面上啊，就是能够做到这个超大数据集亚秒级响应的，诶几乎是只有这个麒麟啊，几乎是只有麒麟是这样的，还是非常强大的啊好，那下边我们往下看，下边有什么，有这个可伸缩性和高吞吐率那个，这个就是指的是咱们麒麟啊，你看啊，单节点可实现每秒70个查询。
15:07
单节点的麒麟啊，能够实现每秒70个查询啊，这是非常非常强的，非常非常强的啊，那你可以琢磨琢磨，咱们你想啊，如果说我一个一个circle，我我让谁我我我用have去查询。我用还选查询，那你想一想，单节点一秒钟能做几个查询，你是不是一个都做不了，对不对，那起点单秒就是单节点能实现一秒70个查询，这是非常非常厉害的啊好，而且呢，它还能够搭建集群。而且还能搭建集群啊，搭建集群这个，那搭完集群之后，我这个伸缩性，我吞吐率就会更高，这是非常棒的啊好，那下边是这个BI工具集成，BI工具集成是因为我们麒麟它是不是提供了接DBC和ODBC接口啊，所以说我能够跟市面上的诶各种各样的这个呃，BI工具进行集成，那都有什么呢？诶比如说如果通过ODBC接口，我可以和他们table AO Excel pro BI的工具进行集成，哎，这些这些其实都是一些咱们这种BI工具Excel的这个Excel，就是我们这个呃，大家熟悉的那个Excel，其实Excel其实是一个非常非常非常强大的报表工具，就是我里边其实能够出各种各样的图也是能出的啊，只不过他的支持的数据量就可能要少一些，要少一些啊。
16:18
好，那现在往下看，那借力BC，我可以跟哪些东西集成呢？可以和这个S库，呃，BI rt，那这些其实是一些Java的这种BI工具，加入BI工具啊，甚至还有谁还有我们的super set，诶我们也是能对接的。好那往下看，下边有一个这个，呃，Rest tpi，那rest CPI我们有了之后呢，我们就能够让它和我们自己的外部应用进行集成，也就是我们可以自己进行二次开发，其实大公司呢，诶很多公司都有这种二次开发啊，很多都都有二次开发，那如果二次开发这些东西呢，就是呃，咱们这个Java的同事去做了，Java同事去做了，好那下边呃，这还有一句话，这是咱们麒麟呢，呃，他的开发团队也贡献了一个zip。那其实这个Z是一个什么东西呢？也是一个BI工具，能够对接各种数据源，然后呢，能够出各种各样的图，它用它主要给谁用的呢？它主要是给我们的这个，呃，分析师去使用的，就是咱们数据分析师去使用，然后进行这个机析查询的，我在里边呢，能够诶写各种查询语句，然后立马出结果，然后甚至直接出图都是可以的，那能够非常方便的去分析咱们的数据啊，能够非常方便的分析数据，主要是给分析分析师去使用的，那一会我们也装上给大家简单的演示一下。
17:30
好，那这就是咱们麒麟的这个基本的一个介绍啊，有它的框架，还有它的这个特点，咱们就说完了，好，那下节课我们就开始去使用这个麒麟了啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（162/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

340

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

239_尚硅谷_即席查询_Kylin_架构_特点

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐