文章/答案/技术大牛

发布

首页视频267_尚硅谷_即席查询_Druid_对比

267_尚硅谷_即席查询_Druid_对比

2022-12-022022-12-02 16:02:23播放41

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/267_尚硅谷_即席查询_Druid_对比.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:01
OK，大家来看这个位置啊，这边的是德鲁伊呢，对呃，跟跟其他的一些这个呃o life框架的这样，或者是这个及其查询框架啊，对，跟其他的一些及其查询框架的这样一个对比，我们来看看啊，这里边的对比是什么样的，我们打开啊。嗯，首先看这个图，这个图呢，其实可能有点老了啊，有点老了，这里边有有两个东西是开发中，实际这个开发中的，现在已经不是开发中了，已经是这个OK的了，已经是yes了啊，已经是yes了，那这个图呢，其实大家可以自己改一下，一会这俩都已经是yes了，都是yes了，那现在我们先逐一的去看一看，咱们这的几个，呃，机器查询框架都有什么，有我们刚学的德鲁伊，有这个麒麟，有prela Spark circle，还有一个ES，那这个ES呢，呃，其实指的就是这个search啊，这个search我们大家可能感觉它是干什么用的呀？诶你这东西不是做这个倒排索引，是做这个全文搜索的嘛，对不对，我们在Java当中，我们确实是主要就是用它来干这个事的。
01:01
到位缩延，然后呢去分词，然后做全文检索，对吧，这是它的强项，那其实啊，这个ES在我们大数据领域当中呢，也有自己的这个应用场景，当然可能应用场景呢，不是那么不是那么的多，但也有用的，也有用的啊那一会我们再简单的介绍一下这个ES，一会再说啊好，那现在呢，我们看看这几个，诶分析框架，他们之间的几个对比项目啊，先看第一点，呃，样本有机响应。就是说能否做到亚美尼响应，你看一下。它是可以，它是可以的，后边全不行。你要记住啊，就是这俩东西。都是会进行预计算的，后边这些东西都没有预计算。你要记住，如果说就是这个这么大的数据量，PBPB级的这样的数据量，能做到亚美有机响应的，现在只有他们两个，就是都只能是预计算你才能做到，那基于内存计算，可能现在这个技术还没有达到那么高啊，还没有那么高，他们还是做不到这个，呃，亚么响应的。这么大的数据量是做不到的啊，当然数据量小这几个东西也能也能亚美积响应，那但是呢，你你有局限，数据量大了就不行了，那他俩的数据量大了，我仍然能做到亚美的响应，就是这点好，那下边呢，是支持这个百亿数据集，百亿数据谁能支持，其实都能支持这个百亿数据集呢，其实不是很大，其实不是很大啊，就是咱们正常的这个PB级诶，甚至是这个GB级诶基本上都能到到达这个百亿，都达到百亿啊，其实这几个都能支持到这个程度。
02:25
都能支持到啊好，那下边呢，这个SQ支持。就是否提供了circle了，那现在呢，德鲁伊也支持circleq了，也能写circleq了，也写circle，哎，那麒麟呢是支持的，后边都支持，只不过这个ES呢，它是不支持的。ES是不支持circle的啊，这个大家要注意好，那下边呢，我们有这个，呃，是否支持离线处理，那离线处理当中呢，我们德鲁伊可以离线，麒麟能离线，这个都能离线，都离线，ES也是能离线的，那这个实时呢，我们实时这边大家来看一下。呃，德鲁伊是能够进行这个实时的，那麒麟能不能进行实时，麒麟也可以进行实时，因为我们再去讲麒麟的时候，我们对接数据源是不是也能对接卡夫卡呀，那对接卡夫卡是不是就是实时计算啊，也是能够执行，也是能够做的，也能做的，那后边这些东西这个他们仨。
03:13
SPA这个都做不了实时，都是离线，都是离线计算啊，都是离线计算，然后后边ES呢，ES是能够做实时的，但是呢，它能分析的指标呢，也是比较有限的，比较有限的啊好了，下边呢，是这个精确驱虫。精确驱虫，那什么叫做精确驱虫呢？所谓精确驱虫啊，就是这个count distinct。Co count distinct的，诶得到一个这样的一个最终的一个统计值，那这个值呢，大家看似简单，诶不就是一个简单的count distinct的吗？但你如果说这个数据量要是上了一定的这个数量级，数据量非常大，那你执行一个这样的count distinct，其实是耗费的资源是很多的，你比如说咱们have当中，我们have当中是不是极力的去避免使用这个count distinct呀？
04:00
对不对，诶是这样的，但是呃，那这边我们看这几个精确驱虫当中，谁做的是最好的，麒麟可以说精确驱虫是做的最好的，那德鲁伊能不能做驱虫，但能做驱虫，但是不能精确驱虫，为什么？因为他有可能丢数据。类似这点，那后边这些东西呢，呃，都能做精确驱虫，就是都能做精，但只不过呢，它们的性能那肯定是没有这个麒麟好的。麒麟还还是能够做到这个快速的反应，快速的响应，而且那个结果呢，也是100%准确的，这是麒麟，而麒麟的那个精确驱虫呢，它使用的也是bit map这个算法。好，那后边呢，呃，ES呢是做不了的，也做不了的啊，那后边是否支持这个多比John多，John呢，我们德鲁伊是不能的，是单表，那麒麟可以，后边是都可以的，这些都可以，那ES呢是不行的，ES不行。好，那下边呢，是否提供了GDPC接口，那这里边德鲁伊没有，ES没有，其他几个是都有的，其他几个都有啊都有。好，这是对他们的几个简单的一个对比，那这个图呢，其实大家可以留着以后去自己做这个技术选型的时候呢，可以参考一下。
05:06
啊。呃，那现在呢，我们去看一看这几个框架。看看这几个框架啊，他们这个各自的一个简简介，咱们逐一的去回顾一下啊，来我们看德鲁伊，德鲁伊是一个什么东西呢？它是一个十处理这个呃，时序数据这样的一个时序数据库。O时序数据库，什么叫做时序数据库呢？就是说呀，我们往德鲁伊里边去写数据的时候呢，它会按照这个时间进行这个分片。会按照时间进行分片，然后我们查询的时候呢，那也是可以按照这个时间去索引数据的，也就相当于我按这个数据啊，往这种时去数据库里边写的时候，你必须得有一个字段是时间字段。必须得有一个时间字段，然后我们往这个德鲁仪里边去存数据的时候呢，我是按照这个时间去进行分片的，诶我一段时间来分一个片，一段时间分一个片，那这样一来，我后续我后续去按照时间去索引数据的时候，那我这个效率是实际上是相当高的，相当高的啊，那这个就是咱们这个德鲁伊它这个底层的一个这个存数据的一个结构啊，这个结构其实叫做一个什么东西呢？叫做一个segment。
06:21
就一个时间分片，叫做一个segment，这个后续呢，我们会诶会会说到的会说到的，这是德鲁伊那呃这个这就是我们所谓的这个持续数据库啊，就是持续库去我们通常都有一个特点，就是有什么会有一个时间字段。回然后呢，存储数据的时候呢，会按照这个诶时间进行分片，那查的时候呢，那我按照时间去索引数据是非常方便的，非常方便的好。它完之后呢，我们看下边，下边是麒麟，那麒麟它的核心是这个QB，是预计算OLP q吧，是这样，这个咱们讲过了，不再说了，好，那往下那pres呢，它快是因为什么呢？是因为这个几乎所有的操作都在内存当中完成，是这样的，它比have呢快一个数量级，一个数量级就是数数十倍，十来倍，OK，那下边隐拍了in拍了，它的特点也是这个，基于这个内存运算。
07:11
但是他支持的数据源是没有price多的，那这个简单了解看下边，下边Spark circle啊，那SPA circle呢这个。呃，我们前面其实也分析过啊，那rk Spark circle呢？嗯，它的思路是什么呢？SPA它的思路是这样的，它呀，它它首先它也是基于内存进行计算的，也是基于内存计算，然后它呢，它是把整个集群当中的内存啊，诶我给它当成这个一大块内存去使用的，诶是这样，它综合的把这个整个的集群当中的资源，我哎我整合起来一起去使用。然后呢，我可以诶，通过增加集群节点去这个并行的计算，并行计算啊，这是Spark circle它的一个这个基本的原理，那这边呢，我们Spark circle呢，不详细讲，因为这个东西放到后边大家会重度的去学习这个Spark的，因为它是在我们大数据领域当中呢，还是非常重要的一个框架，这个后边的大家再详细的学就可以了。
08:02
好，那往下看，下边呢，这个位置还有一个这个ES，呃，这边其实也说了ES，它最大特点是使用这个盗版索引去干什么呀，去做什么全检索啊这些东西，那他在我们大数据领域当中有没有使用场景呢？也是有的，比如说什么我们大家应该有同学听到过一个这样的一个技术站啊，叫做elk。EK，那这个E是什么呢？E就是咱们这个所谓的ES elastic searchl是什么呢？L指的是logit。诶老是K是什么呢？是K是K班的，K班的这其实是三个框架，四三框架，那他们仨怎么去使用呢？这个L是elk啊，不是e fkl是什么？L是log，是它的作用是采集日志。跟谁一样？跟我们学的一样。跟他是一样的角色啊，就是采集日志，那日志采集完之后，我可以放到哪呢？我可以放到ES当中。Serve当中，我可以存到里边，存的时候呢，我会见索引等等这些操作会存到这里，那后边我要干什么，我要做可视化的展示，可视化展示干什么用，谁用K班呢？那K班的呢，它也是一个这样的一个，诶可视化的这样的一个报表工具也也支持什么呀，也支持这个自定义报表啊，这些东西也支持这些功能，跟我们说赛的很像，但是K班呢，它有个特点，就是我的数据源呢，只能对对接他自家的这个ES。
09:24
只能对接ES啊，也就说我们是有一个这样的一个技术站的，也说他是直接从日志到最终的结果，哎，他能进行这个分析，那ES呢，我们能做的分析其实不多，只能做一些简单的这种聚合分析，只能做一些聚合分析啊，诶然后呢，做一些这个可视化的展示，也有使用的也有，诶一般用的时候呢，大致都是这么用整个的一个技术站，Logsh，这个search加这个班的。这个应该在后边我们的实时项目当中呢，诶应该会用到它，应该是会用到它的啊，那这边其实不是说了吗？ES这边我们是支持这个实时分析的，知时分析的，后边呢，我们应该是会用到的，这个到大到时候大家学的时候呢，再去，诶正常学就行了。
10:06
呃，对，现在呢，其实也有一个这个呃框架叫做这个fluent dent d啊，它其实呃跟我们现在的书上第一课提过12K提过是吧，那你知道就可以了，那现在呢，其实确实是外边呢也开始去使用这个呃fluent d了，那fluent d这个东西呢，其实呃也跟咱们flu的架构呢，其实也是很像的。也是很像的啊，就是说呃，也是基本上有source，有这个中间的title，有S结构基本类似，结构基本类似啊，那其实对于这个日志采集呢，我们在市面上其实有好多竞品，好多竞品啊，比如说flu d lost这些东西基本上都是竞品，就是他们功能都是一样的，都是采集日志，都采集日志啊，那这个其实用的都有都有啊好，那这个是我们简单的，呃，了解了一下这几个框架。那现在呢，我们最终有一个总结啊，就是咱们真正去做技术选型的时候，咱们到底应该怎么去选呢？我们其实可以从这样的几个角度去分析，几个角度去分析啊，咱们既然是机器查询对不对，那机器查询啊，我们你就得看，你就得看什么啊，诶首先第一点你的查询业务是什么，如果说你这只需要做这种ola分析。
11:14
就是多维分析，那OK可以选什么呀。可以选啥只做OLED分析，那我是不是可以考虑诶德鲁伊或者麒麟啊，他俩有什么好处呢？因为我的查询效率是最高的，而且我支持的数据量是非常非常大的。是非常大的。是这样的，首先你考虑这个事，那如果说。你除了做这种olap分析，你还要做一些更复杂的一些这种，呃搜库查询啊，比如说各种这各种这个子查询等等等，你要做这种复杂的查询，那这时候呢，呃，你可能用这个德鲁伊麒麟，那可能用起来就不是那么方便了，对不对，就不那么方便了，那这时候你去考虑谁呢？去考虑这个什么psto啊，X Spark这些东西。是这样的啊，首先先考虑这个业务，那考虑完业务之后呢，咱们考虑什么，考虑这个呃，数据集。
12:00
数集，如果说你的数据集是非常非常大的啊，超大数据集，那这时候呢，我们还是首选德鲁和麒麟，因为他俩是什么，他俩是预计算，就是我的数据集，甭管多大，我的查询时间基本能够维持在这个较低的一个水平。那如果说你是什么press，你是Spark circle，你是EL了，诶像这些基于内存进行计算的这些框架啊，它都会什么？随着数据的增长，我的查询时间肯定都会增长。那这时候如果说数据量非常大，我们考虑使用麒麟和多鲁伊，那呃在后边呢，就是pre SPA circle这样这样的一个顺序，那如果说我们要考虑的是什么呢？考虑我这个呃，支持的数据源种类。要考虑这个东西，那也就是说可能我进行这个多元分析的时候呢，进行这个呃机查询的时候，我可能要从多个数据源去获取数据，然后综合的进行查询，那这时候你就得考虑什么了呀，就得考虑诶这个数据源的支持程度了，考虑谁？首先presal支持的数据源是最丰富的，是最丰富的啊，它能够支持什么，能够支持时序数据，那个那个图数据库，能够支持咱们的这个no s数据库，诶还能够支持什么呀，能够支持咱们的呃，这个关型数据库对不对？诶甚至支持have等等，它都支持，这是比较全的啊，那接下来是谁？接下来是SPA。
13:16
我们大自己去学Spark的时候，其实也能发现我们Spark s也能支持好几种这个数据源，但是它还是没有多，那再往后呢，就是这个麒麟，我们麒麟这边呢，能对接离线，能对接实时，其实也还好也好，那再往后呢，就是这个德鲁伊了，再后德鲁伊这是咱们这个支持的数据源的这个种类。好，那这就是咱们这边的几个框架的一个简单的对比，这块呢，大家就是呃，简单的看一看就可以了，然后这个哪块比较重要呢？这块比较重要。这会比较重要，然后哪呢，还有这块就是说他们几个的一个性能的一个对比，大家可以简单的去记忆一下，是这样的啊，然后像这个ES啊，像Spark这些东西，我们像这东西咱们现在都没学，嗯，可能你对他印象不深，这个等大家以后学了之后，那再回过头来看，那就会有更深的这个理解了啊好，那这边咱们就完事了啊。
14:06
那再往下呢，就是这个德鲁伊的这个框架了，呃，这个框架原理相对来说要复杂一些，所以说我们现在先先不讲它，我们休息一会儿再讲啊，一会再讲，那下节课咱们把这讲了，讲了之后，那德鲁伊呢，我们就呃，接下来就去安装安装，然后使用一下就可以了，好，下回休息会吧。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（193/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

330

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

267_尚硅谷_即席查询_Druid_对比

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐