文章/答案/技术大牛

发布

首页视频266_尚硅谷_即席查询_Druid_概述

266_尚硅谷_即席查询_Druid_概述

2022-12-022022-12-02 16:02:23播放37

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V2.0/视频/266_尚硅谷_即席查询_Druid_概述.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:01
变强那种。好，那我们现在看这个第二一个这个德鲁伊，那德鲁伊呢，呃，他这个首先先明确一个概念啊，这边其实也也有这个所有同学可能已经这个，呃也犯过这个错误了啊，呃，把什么呀，把咱们阿里的那个，呃那个数据库连接池德鲁伊跟咱们这讲的这个德鲁伊搞混了，其实他们俩是没有任何关系的啊，是没有任何没有任何关系的，先把这个明确。啊，完了之后呢，我们看德鲁伊他的这个基础的介绍是什么。还是这个一句话的这样的一个，呃，一个概概述，我们看看它是什么东西来德鲁伊，它是一个快速的。劣势的劣势指的什么？劣势存储德鲁伊呢，它是一个最终它落在什么地方，落在一个存储系统上面了，对不对，它是能存数据的，能存数据的它是一个列式存储的，然后后边呢，诶是一个分布式的一个集群，对吧？然后这个比较关键，它是支持实时分析的。
01:01
支持实时分析，而且它这个实时呃分析的性能呢，还是比较强大的，还是比较强大是支持实时分析的，那然后在后边呢，它的这个呃，它的这个性能如何呢？我们来看一看，它在处理这个PB级，PB级数据是PB级的啊，然后诶毫秒级查询，当然呢，也就是数根据跟什么有关系啊，也其实跟数据量有关系，如果数据量比较小，那OK，我能做到毫秒级，那如果数据量呃相对来说要比较大的话呢，我基本上也能做到这个压秒秒级这个这个这个程度。亚秒秒级啊，那后边呢，在实时处理诶，这个数据的方面对不对，它是比较强的，然后后边呢，它比传统的ola olap系统有了显著的性能性能改进，这块大家要注意啊，你要从这句话当中呢，你要读出它的这个言位之意来，言为之意什么。他既然跟传统的o lifep去比，那说明它是一个什么，它是不是就是一个o lifep系统啊，Op分系统，也就是他其实也是做这个多维分析的。
02:02
也是多维分析的啊，只不过呢，我能干什么，我能做实时分析，能做实时分析啊，这是咱们对德鲁伊的一个这个初步的一个认识啊，初步认识，然后现在呢，我们再来总结一下，首先德鲁伊能干什么，首先它是能够呃这个处理PB级的数据，然后能够毫秒级查询，然后能干什么，能够进行实时的分析。那实际什么分析呢？是o life多维分析对不对，然后它它它它跟那个我们前面讲的其他的那个什么机器查询框架有什么区别呢？它有一个特点就是，诶我是啥呀，我能够存储数据。我能存储，它是存储系统，实际上呢，德鲁伊你可以说它是一个什么东西呢？是一个时序数据库。时序数据库啊，什么叫时序数据库呢？这一会儿我们再解释，也就是它会存数据，也就他说白了既能存数据，也能分析数据，也能分析数据，而且能够进行实时分析，当然这个离线分析批处理它也能做，也是他既能做批处理，也能做这个实时分析，这还是比较强的啊，然后大家来看一下啊。
03:06
PB级的数据，诶在这呢啊。PB级的数据能做到这个毫秒级，当然这个毫秒级可能有点夸张，可能是夸奖啊，但至少他是能做到秒级亚秒级的。PB级的数据能做到这个级别，那其实啊，哎，它也是得益于什么呢？其实它也是得益于这个。预计算的。也是德于一计算的，也是我们德鲁伊呢，其实也会进行预计算，也会进行预计算啊好，这是我们先对德鲁伊有一个这样的一个初步的认识，好下边这个注意事项呢，咱们就呃不看了，然后往下，下边呢是这个德鲁伊他的特点，咱们把这个特点呢，呃，一起来看一下。首先德鲁伊它的第一个特点就是说它采用了劣势存储，因为什么，因为德鲁伊呢？呃，我们前面也分析了，它是一个什么，它是一个是不是也是o life呀，O分析这o op这样的一个分析分析系统，当然它也会存储数据啊，诶那多维分析我们通常是怎么分析啊，多维分析是不是就是选里边特定的某几个字段啊，然后对聚合值，呃，对那个度量值进行聚合对不对，那通常都是这么去选择，那你采用劣势存储，那是不是正好是适合咱们这种多维分析啊。
04:16
是这样，所以这个应该很好理解，那下边呃，它是一个可扩展的分布式这样的一个系统，也就是它呢，呃可以部署到数十或者数百台机机群上，所以说它这个呃延呃延伸性的呃呃可扩展性的还是比较强的，扩展性还是比较强的啊好，那它完之后呢，往下看。他能够进行大规模的并行处理，大规模的并行处理，其实大家一会儿后续可以观察到，我们德鲁伊当中呢，他这个集群的角色其实有很多个，好几个角色，但是他每一个角色我都可以给他配置多个。也就是说，所有的任务几乎都可以并行完成。都可以并行处理，所以说它这个并行处理的能力还是比较强大的，好，那他完事之后呢，我们往下看。
05:00
下边呢，呃，这个，呃，实时或者是批量摄取这一点指的是什么呢？就咱们德鲁伊啊，前面不是讲了吗？它能够存数据对不对，那既然要存数据设计，也就是说你得往里边写吧，对不对？那你往里边写的时候呢，我既可以实时的写，也可以批量的写，那实时的写应该对接谁？实时的写，我们通常对接的是卡夫卡，就是数据呢？诶通过卡夫卡实时的写入咱们的德鲁伊是可以的，那也可以批量的写，批量写可以从哪写呢？可以从咱们这种分布式的存储系统里边，诶直接拿出去批量的一次性的写到德鲁伊也是可以的。哎，是这样的啊，那你批量的写，那我后续就可以批量的分析，你实时的写，那我我就可以实时的分析。是这样的啊，是比较强大的，好，那完了之后呢，我们往下看下边这个地方呢，有一个什么，有一个这个呃，自愈自平衡易操作，有一个这样的特点，这个指的是什么啊，就是说咱们指的其实指的是这个德鲁伊啊，我们维护起来是非常方便的。
06:00
维护起来非常方便，为什么方便呢？来看一下。它呢就是说如果说我们要想去扩展或者是缩小这个集群的话，那我们诶只需要做一些简单的添加或者删除服务器这样的一些操作就可以了，然后你把这个服务器添加或删除完之后呢，做一些简单的配置之后呢，那我们集群当中的所有的任务呢，它就会自动的给你均衡。也就是说它自动的就把你这个这个节点呢给你，诶给你分配的任务了，诶自动均衡这一步呢，诶是不需要我们进行停机的，是不需要进行停机的啊，这是非常非常强大的，非常非常不错的啊，有可以热更新热扩展热扩展啊OK，这是它，那它完之后呢，我们看下边，下边呢，我们有一个第第六一点那个数据呢，进行了有效的预集合和预计算，所以查询速度快，也就是他查的快也是得益于预计算的。好，那这个怎么去计算，我们后续再说啊好了，那最后一个，那这个数据呢，它的结果应用了这个bit map压缩算法啊，那bit map呢，这个算法呢，应该其实还是比较有名的啊，就是在这个我们的麒麟当中呢，其实也应用了bit map压缩算法，那这个算法呢，其实在什么领域是比较强的呢？在我们的这个呃，压缩以及什么呀，以及咱们这个就是那个这个驱虫，诶这在这些领域它是比较强大的，比较强大的，那我们的这个麒麟呢，其实它麒麟有一个点是非常强大的，就是做这个精确驱虫。
07:29
什么叫精确驱虫呢？所谓精确驱虫就是去呃去统计这个count distinct的值Co count distinct这个我们在使用麒麟的时候，应该它那个聚合函数当中有一个count distinct，这个应该大家当时是看到了count distinct，那我们麒麟在做这种count distinct，这而而且是大数据量的啊，大数据量的这个精确驱虫，这个麒麟是做的非常好的，那这里边麒麟这里边呢，就应用了，也是应用了这个bit map这个算法。这个算法就这个算法呢，它不不是说它是一个压缩算法，也就是他可以干的事很多，可以干的事很多啊，他在压缩在这个精确驱虫这些领域呢，是非常非常强大的，好，那感兴同学呢，感兴趣的同学呢，可以自己去了解一下，咱们这儿就不展开讲了，好那他玩之后呢，我们往下看，下边是咱们这个德鲁伊的这个简单的使用场景，我们来看看啊，其实这个德鲁伊它的使用场景呢，呃，相对来说还是比较苛刻的。
08:22
还是比较苛刻的啊，我们来看一下。首先第一点我们使用德鲁伊的时候呢，要求我们把这个数据得提前清洗好，清洗好然后呢，呃，写到德鲁伊里边之后呢，诶是不要进行这个更新操作的。呃，那我们前面讲了德鲁伊会干什么，德鲁伊是不是会存数据啊，会存储数据，那大家要注意，大家要注意注意什么东西呢？就是说他我们虽说是一个所谓的一个数据库会存数据，那大家可能会觉得我的数据库是不是就会进行增删改查这些操作呀，对不对，但实际咱们德鲁伊呢，我们诶要求什么呀，是不需要进行更新操作，也就是他只只干什么，只是存，存完之后呢，只是什么，只是查分析。
09:04
分析啊，你不能把它当做一个咱们这种普通的数据库去使用，就是我是纯数据，然后诶只能是分析，以分析为主，那而且你往里边写数据，还得写什么样的数据呢，还得写这个清洗好的数据，清洗好的也就是说得是什么样的，得是结构化的，结构化的。那比如说举个例子啊，咱们德鲁伊我往里边写数据的时候，我可以通过谁可以通过卡夫卡里边通，通过卡夫卡往里边写对不对，那实时的往里写，那大家可能会觉得，诶，我卡夫卡卡夫卡写的数据不就是一行吗？一行一行的写对不对，一行一行的写，那这边我们是不是得要求是结构化的呀，对不对？那也就是说你卡夫卡往德鲁伊里边写数据的时候啊，你那个数据的格式是有要求的。得给它调成什么样的格式呢？得是结构化的，比如说杰森对吧，比如说CSV，比如说TSV，得是这样的文件才可以。改这样可以文件才可以啊，所以说这块呢，大家都要注意，大家要注意得是清洗好的好，那完了之后呢，往下看，下边呢，我们德鲁伊诶支持宽表。
10:05
单表查询单表查询不用join。单表查询不用join，这是我们德鲁伊这边的一个点啊，就是说不要用join，只是单表就是单表，然后这个单表当中呢，其实这个单表啊，大家要注意单表，它这既然是表对不对，那表里边肯定有行有列对不对，那这里边呢，我们其实也可以分为这样的两类，一类呢是维度。一类是度量，这也是我们传统的这个o life分析里边的概念，有维度，有度量，跟我们麒麟是一个一套理论，一套理论啊，那也就是说我们数据诶这么给他定义好之后呢，那往德仪里边写的时候呢，会干什么，会进行预计算。出行预算，那预算完之后呢，后续你干什么，是不是就可以直接查询结果了呀，是这样的，其实德鲁伊呢，我们往里边写数据的时候，那个流程大致就是这样的，那这个我们后续还会再详细的分析的啊好，那这是就记住这个是单表查询，不要用照OK，那再往下下边呢，这句话呢，呃，就是写的可能比较这个比较抽象啊，读不懂是吧，那你就不用读它了，我给大家说一下这是什么东西啊，这块他想表达的呢，就是说我们德鲁伊适合干什么，适合统计这些，诶o lap指标，OL分AP就是多维分析指标，那也就说你那个circle写的时候怎么写，也就是说诶是不是维度维度，然后聚合函数后边呢，加上格入Y这个维度啊。
11:25
对吧，也就是跟咱们其类似，就只能是查询这种多维分析的指标，复杂的咱们德鲁伊这边是做不了的，我们只做o lap分析，O lap分析啊好，那下边呢往下看。呃，适用于这个实时性要求较高的场景，因为它强项是不是就是实时分析比较厉害啊，好，那完了之后看下边，下边第五一个点呢，就是说适用于对数据质量敏感度不高的场景啊，这个东西怎么回事，给大家说一下啊，这个要注意，呃就是说呃，看这个意思啊，就是说这个德鲁伊是不是有点不太靠谱啊，这意思对不对？呃，什么叫数据质量，也就是说咱们这个数据呢，就是哎，算完之后你得确保我这个数据是诶准确的，你不能丢一部分的数据对不对。
12:07
就是所谓的数据质量。那这边也就是说德鲁伊呢，适用于对数机质量敏感度不高的场景，那言外之意就是说我们使用德鲁伊的时候，我的计算结果是不是可能不是100%准确的呀，是有可能会丢一部分数据的，其实是这个意思，那这是为什么呢？这其实啊是跟我们德鲁伊它的这个架构是有关系的，那一会儿我们讲完它的架构之后呢，给大家分析一下它为什么会诶导致这个数据的丢失，一会再分析啊好，那这个就是咱们德鲁伊的适用场景。那总结一下就是什么呀？哎，适用于这个什么样的，得是这个呃，清洗好的数据，清洗好的数据，然后能做什么样的分析呢？能做这种o life分析，多维分析对吧？然后强项在什么地方，强项在这个实时上面，然后数据诶不是很准确，不是100%准确，然后边呢，就是说单表查询，不要照这是它的一些场景，好，那这个咱们简单的就分析完了啊，那在下边呢，这块有一节，这一小节呢，其实还是比较不错的，我们呃先单独的录一下吧，一会。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V2.0

（192/300）

10分15秒

01_尚硅谷_课程介绍

430

2分27秒

02_尚硅谷_数仓概念_业务数据

470

3分32秒

03_尚硅谷_数仓概念_用户行为数据

430

10分43秒

04_尚硅谷_数仓概念_数仓概述

420

8分31秒

05_尚硅谷_数仓架构_项目需求

410

3分33秒

06_尚硅谷_数仓架构_技术选型考虑因素

410

9分24秒

07_尚硅谷_数仓架构_技术选型

440

9分58秒

08_尚硅谷_数仓架构_数仓架构

350

11分55秒

09_尚硅谷_数仓架构_框架版本选型

370

6分18秒

100_尚硅谷_数仓理论_函数依赖

350

7分46秒

101_尚硅谷_数仓理论_三范式

360

11分46秒

102_尚硅谷_数仓理论_关系建模和维度建模

450

4分43秒

103_尚硅谷_数仓理论_维度表

400

28分2秒

104_尚硅谷_数仓理论_事实表

380

10分46秒

105_尚硅谷_数仓建模_ODS层

290

10分22秒

106_尚硅谷_数仓建模_DWD层_选择业务过程

350

15分8秒

107_尚硅谷_数仓建模_DWD层_声明粒度

380

16分53秒

108_尚硅谷_数仓建模_DWD层_确定维度

350

11分38秒

109_尚硅谷_数仓建模_DWD层_确定事实

340

8分34秒

10_尚硅谷_数仓架构_服务器选型

350

19分5秒

110_尚硅谷_数仓建模_DWS层_DWT层_ADS层

350

6分21秒

111_尚硅谷_数仓建模_总结

370

3分43秒

112_尚硅谷_数仓搭建_ODS层_要做哪些事

350

3分22秒

113_尚硅谷_数仓搭建_ODS层_创建数据库

340

6分43秒

114_尚硅谷_数仓搭建_ODS层_启动日志处理分析

340

10分29秒

115_尚硅谷_数仓搭建_ODS层_启动日志处理实现

410

5分36秒

116_尚硅谷_数仓搭建_ODS层_事件日志处理

370

5分46秒

117_尚硅谷_数仓搭建_ODS层_单引号和双引号区别

440

11分28秒

118_尚硅谷_数仓搭建_ODS层_用户行为数据脚本编写

320

3分9秒

119_尚硅谷_数仓搭建_ODS层_脚本问题解决

270

7分56秒

11_尚硅谷_数仓架构_集群规模

370

10分14秒

120_尚硅谷_数仓搭建_ODS层_业务数据创建表

310

12分18秒

121_尚硅谷_数仓搭建_ODS层_业务数据脚本编写

320

15分3秒

122_尚硅谷_数仓搭建_DWD层_启动日志表

400

6分15秒

123_尚硅谷_数仓搭建_DWD层_启动日志表脚本

380

13分34秒

124_尚硅谷_数仓搭建_DWD层_事件日志表解析分析

410

59秒

125_尚硅谷_数仓搭建_DWD层_事件日志表建表

380

4分33秒

126_尚硅谷_数仓搭建_DWD层_自定义UDF函数分析

300

8分56秒

127_尚硅谷_数仓搭建_DWD层_自定义UDF函数_创建工程

360

15分28秒

128_尚硅谷_数仓搭建_DWD层_自定义UDF函数_代码编写

470

4分29秒

129_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_分析

330

8分26秒

12_尚硅谷_数仓架构_集群具体规划

360

16分28秒

130_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（上）

370

8分31秒

131_尚硅谷_数仓搭建_DWD层_自定义UDTF函数_实现（下）

400

10分57秒

132_尚硅谷_数仓搭建_DWD层_解析事件日志

360

9分37秒

133_尚硅谷_数仓搭建_DWD层_解析脚本

320

15分43秒

134_尚硅谷_数仓搭建_DWD层_事件日志（3月10日完成）

290

4分27秒

135_尚硅谷_数仓搭建_DWD层_事件日志脚本（3月11日完成）

330

14分1秒

136_尚硅谷_数仓搭建_DWD层_业务_商品维度（上）

350

10分39秒

137_尚硅谷_数仓搭建_DWD层_业务_商品维度（下）

320

1分46秒

138_尚硅谷_数仓搭建_DWD层_业务_优惠卷维度

350

8分59秒

139_尚硅谷_数仓搭建_DWD层_业务_活动维度

360

7分8秒

13_尚硅谷_用户行为采集_公共字段格式

260

2分7秒

140_尚硅谷_数仓搭建_DWD层_回顾

390

10分1秒

141_尚硅谷_数仓搭建_DWD层_地区维度

290

7分18秒

142_尚硅谷_数仓搭建_DWD层_时间维度

330

16分26秒

143_尚硅谷_数仓搭建_DWD层_订单明细事实表

370

11分58秒

144_尚硅谷_数仓搭建_DWD层_支付事实表

340

5分19秒

145_尚硅谷_数仓搭建_DWD层_退款事实表

380

3分58秒

146_尚硅谷_数仓搭建_DWD层_评论事实表

430

16分38秒

147_尚硅谷_数仓搭建_DWD层_加购事实表

300

3分35秒

148_尚硅谷_数仓搭建_DWD层_收藏事实表

310

29分16秒

149_尚硅谷_数仓搭建_DWD层_优惠卷事实表分析

330

8分1秒

14_尚硅谷_用户行为采集_事件字段格式

420

14分4秒

150_尚硅谷_数仓搭建_DWD层_优惠卷事实表完成

330

6分34秒

151_尚硅谷_数仓搭建_DWD层_基本函数

350

25分2秒

152_尚硅谷_数仓搭建_DWD层_订单事实表分析

320

19分23秒

153_尚硅谷_数仓搭建_DWD层_订单事实表完成

400

20分43秒

154_尚硅谷_数仓搭建_DWD层_拉链表理论

330

16分41秒

155_尚硅谷_数仓搭建_DWD层_拉链表实操

340

16分20秒

156_尚硅谷_数仓搭建_DWD层_脚本编写

410

9分34秒

157_尚硅谷_数仓搭建_DWS层_业务术语（上）

400

9分7秒

158_尚硅谷_数仓搭建_DWS层_业务术语（下）

320

13分48秒

159_尚硅谷_数仓搭建_DWS层_基本函数

360

10分9秒

15_尚硅谷_用户行为采集_事件日志（上）

380

5分41秒

160_尚硅谷_数仓搭建_DWS层_DWS_DWT_ADS介绍

300

17分43秒

161_尚硅谷_数仓搭建_DWS层_每日设备行为宽表

310

12分38秒

162_尚硅谷_数仓搭建_DWT层_设备主题_分析

310

23分17秒

163_尚硅谷_数仓搭建_DWT层_设备主题_实现

450

29分12秒

164_尚硅谷_数仓搭建_DWS层_会员行为宽表

360

28分2秒

165_尚硅谷_数仓搭建_DWT层_会员主题宽表

390

10分32秒

166_尚硅谷_数仓搭建_DWS层_商品主题宽表

330

14分33秒

167_尚硅谷_数仓搭建_DWT层_商品主题

370

10分4秒

168_尚硅谷_数仓搭建_DWS层_优惠卷及活动宽表

470

3分55秒

169_尚硅谷_数仓搭建_DWS层_每日购买行为宽表

320

10分19秒

16_尚硅谷_用户行为采集_事件日志（下）

360

29分22秒

170_尚硅谷_数仓搭建_数仓架构回顾

400

16分57秒

171_尚硅谷_数仓搭建_ADS_活跃设备数

340

1分58秒

172_尚硅谷_数仓搭建_ADS_新增设备数

330

3分4秒

173_尚硅谷_数仓搭建_ADS_沉默用户

360

18分6秒

174_尚硅谷_数仓搭建_ADS_活跃设备讲解

340

10分1秒

175_尚硅谷_数仓搭建_ADS_新增设备讲解

340

5分59秒

176_尚硅谷_数仓搭建_ADS_沉默设备讲解

270

3分44秒

177_尚硅谷_数仓搭建_ADS_本周回流设备需求分析

370

2分6秒

178_尚硅谷_数仓搭建_ADS_流失设备需求分析

430

5分42秒

179_尚硅谷_数仓搭建_ADS_留存率需求分析

260

2分42秒

17_尚硅谷_用户行为采集_启动日志

320

4分0秒

180_尚硅谷_数仓搭建_ADS_连续需求分析

430

6分50秒

181_尚硅谷_数仓搭建_ADS_dwt_sku_topic_纠错

340

100

21分59秒

182_尚硅谷_数仓搭建_ADS_本周回流用户

360

101

3分21秒

183_尚硅谷_数仓搭建_ADS_流失用户

380

102

8分40秒

184_尚硅谷_数仓搭建_ADS_留存率_思路分析

340

103

15分23秒

185_尚硅谷_数仓搭建_ADS_留存率_编码

390

104

11分52秒

186_尚硅谷_数仓搭建_ADS_连续三周活跃

280

105

2分51秒

187_尚硅谷_数仓搭建_ADS_本周回流_补充

350

106

21分9秒

188_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路一

370

107

6分54秒

189_尚硅谷_数仓搭建_ADS_最近7天连续3天_思路二

340

108

14分42秒

18_尚硅谷_用户行为采集_日志生成_分析

370

109

3分33秒

190_尚硅谷_数仓搭建_ADS_会员主题信息_需求分析

350

110

3分27秒

191_尚硅谷_数仓搭建_ADS_漏斗分析_需求分析

330

111

3分9秒

192_尚硅谷_数仓搭建_ADS_商品销量TopN_需求分析

350

112

1分9秒

193_尚硅谷_数仓搭建_ADS_商品收藏TopN_需求分析

340

113

11分40秒

194_尚硅谷_数仓搭建_ADS_会员信息统计

400

114

18分56秒

195_尚硅谷_数仓搭建_ADS_漏斗分析

340

115

6分54秒

196_尚硅谷_数仓搭建_ADS_商品个数统计

410

116

7分4秒

197_尚硅谷_数仓搭建_ADS_销量_收藏_TopN

410

117

1分12秒

198_尚硅谷_数仓搭建_ADS_商品加购_需求分析

360

118

2分25秒

199_尚硅谷_数仓搭建_ADS_商品退款率_需求分析

370

119

14分4秒

19_尚硅谷_用户行为采集_日志生成_代码说明

310

120

1分43秒

200_尚硅谷_数仓搭建_ADS_商品差评率_需求分析

450

121

4分45秒

201_尚硅谷_数仓搭建_ADS_下单数目统计_需求分析

370

122

6分43秒

202_尚硅谷_数仓搭建_ADS_支付信息统计_需求分析

330

123

8分23秒

203_尚硅谷_数仓搭建_ADS_复购率_需求分析

370

124

5分24秒

204_尚硅谷_数仓搭建_ADS_画图软件

450

125

1分54秒

205_尚硅谷_数仓搭建_ADS_商品加购排行

380

126

8分8秒

206_尚硅谷_数仓搭建_ADS_商品退款率排行

390

127

3分5秒

207_尚硅谷_数仓搭建_ADS_商品差评率排行

340

128

6分2秒

208_尚硅谷_数仓搭建_ADS_下单信息统计

370

129

15分4秒

209_尚硅谷_数仓搭建_ADS_支付信息统计

370

130

7分10秒

20_尚硅谷_用户行为采集_日志生成_LogBack配置

410

131

18分48秒

210_尚硅谷_数仓搭建_ADS_复购率

390

132

9分38秒

211_尚硅谷_任务调度_Azkaban_工作流程分析

470

133

10分34秒

212_尚硅谷_任务调度_Azkaban_部署_准备

280

134

15分33秒

213_尚硅谷_任务调度_Azkaban_部署_配置

310

135

5分52秒

214_尚硅谷_任务调度_Azkaban_MySQL建库建表

420

136

14分41秒

215_尚硅谷_任务调度_Azkaban_Sqoop导出脚本

370

137

14分26秒

216_尚硅谷_任务调度_Azkaban_数据准备

350

138

10分20秒

217_尚硅谷_任务调度_Azkaban_Job文件

410

139

4分4秒

218_尚硅谷_任务调度_Azkaban_Shell脚本准备

420

140

5分54秒

219_尚硅谷_任务调度_Azkaban_定时调度

410

141

5分34秒

21_尚硅谷_用户行为采集_虚拟机克隆

410

142

4分13秒

220_尚硅谷_任务调度_Azkaban_调度结果

380

143

12分19秒

221_尚硅谷_任务调度_Azkaban_拉链表复习

380

144

7分12秒

222_尚硅谷_任务调度_Azkaban_商品主题宽表纠错

370

145

4分30秒

223_尚硅谷_任务调度_Azkaban_任务重跑问题

440

146

7分6秒

224_尚硅谷_数据可视化_Superset

400

147

6分28秒

225_尚硅谷_数据可视化_Superset_miniconda介绍

250

148

7分26秒

226_尚硅谷_数据可视化_Superset_miniconda安装

350

149

4分35秒

227_尚硅谷_数据可视化_Superset_Python环境创建

320

150

6分13秒

228_尚硅谷_数据可视化_Superset_安装

320

151

4分27秒

229_尚硅谷_数据可视化_Superset_配置

390

152

9分45秒

22_尚硅谷_用户行为采集_虚拟机配置

350

153

6分59秒

230_尚硅谷_数据可视化_Superset_启停

400

154

5分39秒

231_尚硅谷_数据可视化_Superset_对接MySQL安装依赖

330

155

5分50秒

232_尚硅谷_数据可视化_Superset_对接MySQL数据源配置

430

156

10分26秒

233_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘_图形

300

157

2分40秒

234_尚硅谷_数据可视化_Superset_对接MySQL配置仪表盘

370

158

3分50秒

235_尚硅谷_数据可视化_Superset_补充

300

159

6分54秒

236_尚硅谷_即席查询_概述

360

160

6分8秒

237_尚硅谷_即席查询_Kylin_概述

350

161

29分50秒

238_尚硅谷_即席查询_Kylin_前置知识

310

162

17分40秒

239_尚硅谷_即席查询_Kylin_架构_特点

360

163

5分59秒

23_尚硅谷_用户行为采集_JDK安装

260

164

11分19秒

240_尚硅谷_即席查询_Kylin_部署_HBase

420

165

5分26秒

241_尚硅谷_即席查询_Kylin_部署_解压

340

166

3分21秒

242_尚硅谷_即席查询_Kylin_部署_环境变量

320

167

4分41秒

243_尚硅谷_即席查询_Kylin_部署_启动准备

380

168

2分59秒

244_尚硅谷_即席查询_Kylin_部署_启动

290

169

5分56秒

245_尚硅谷_即席查询_Kylin_部署_启动错误_解决方案

350

170

17分7秒

246_尚硅谷_即席查询_Kylin_使用_定义model

380

171

14分49秒

247_尚硅谷_即席查询_Kylin_使用_定义cube

340

172

16分55秒

248_尚硅谷_即席查询_Kylin_使用_重复key问题解决

370

173

7分26秒

249_尚硅谷_即席查询_Kylin_Hadoop历史服务器问题原因

370

174

6分14秒

24_尚硅谷_用户行为采集_Hadoop安装及配置前准备

350

175

7分26秒

250_尚硅谷_即席查询_Kylin_查询

410

176

15分41秒

251_尚硅谷_即席查询_Kylin_定时调度脚本

380

177

10分37秒

252_尚硅谷_即席查询_Kylin_cube存储原理

310

178

13分33秒

253_尚硅谷_即席查询_Kylin_cube构建原理

310

179

13分53秒

254_尚硅谷_即席查询_Kylin_cube_优化_聚合组

420

180

11分52秒

255_尚硅谷_即席查询_Kylin_cube_优化_衍生维度

330

181

13分14秒

256_尚硅谷_即席查询_Kylin_cube_优化_Rowkey设计

450

182

5分32秒

257_尚硅谷_即席查询_Kylin_cube_优化_并发粒度优化

280

183

13分41秒

258_尚硅谷_即席查询_Kylin_cube_BI对接_JDBC

320

184

10分50秒

259_尚硅谷_即席查询_Kylin_cube_BI对接_Zeppelin

380

185

12分51秒

25_尚硅谷_用户行为采集_Hadoop集群配置

330

186

21分29秒

260_尚硅谷_即席查询_Presto_概念

440

187

16分38秒

261_尚硅谷_即席查询_Presto_部署_Server

340

188

2分15秒

262_尚硅谷_即席查询_Presto_启动_Server

370

189

14分26秒

263_尚硅谷_即席查询_Presto_部署_命令行客户端

370

190

7分39秒

264_尚硅谷_即席查询_Presto_部署_可视化客户端

380

191

17分52秒

265_尚硅谷_即席查询_Presto_使用注意事项

370

192

13分6秒

266_尚硅谷_即席查询_Druid_概述

370

193

14分24秒

267_尚硅谷_即席查询_Druid_对比

410

194

17分40秒

268_尚硅谷_即席查询_Druid_架构

340

195

5分8秒

269_尚硅谷_即席查询_Druid_数据结构

370

196

2分42秒

26_尚硅谷_用户行为采集_项目经验_HDFS多目录

410

197

9分17秒

270_尚硅谷_即席查询_Druid_部署

290

198

12分35秒

271_尚硅谷_即席查询_Druid_使用

370

199

5分23秒

272_尚硅谷_集群监控_Zabbix_概述

380

200

8分42秒

273_尚硅谷_集群监控_Zabbix_架构

350

201

2分15秒

274_尚硅谷_集群监控_Zabbix_部署_说明

340

202

4分18秒

275_尚硅谷_集群监控_Zabbix_部署_Server节点_准备

380

203

10分17秒

276_尚硅谷_集群监控_Zabbix_部署_Server节点_创建用户_建库建表

350

204

10分44秒

277_尚硅谷_集群监控_Zabbix_部署_Server节点_编译环境准备

360

205

3分52秒

278_尚硅谷_集群监控_Zabbix_部署_Server节点_编译及安装

340

206

3分50秒

279_尚硅谷_集群监控_Zabbix_部署_Server节点_配置

380

207

2分59秒

27_尚硅谷_用户行为采集_项目经验_节点间数据均衡

320

208

26分23秒

280_尚硅谷_集群监控_Zabbix_部署_Server节点_系统服务脚本编写

370

209

11分6秒

281_尚硅谷_集群监控_Zabbix_部署_Server节点_web部署

470

210

4分54秒

282_尚硅谷_集群监控_Zabbix_部署_Server节点_启动

390

211

7分17秒

283_尚硅谷_集群监控_Zabbix_部署_Server节点_web

390

212

8分14秒

284_尚硅谷_集群监控_Zabbix_部署_Agent_节点部署

350

213

7分54秒

285_尚硅谷_集群监控_Zabbix_使用_术语

310

214

8分16秒

286_尚硅谷_集群监控_Zabbix_使用_创建主机

340

215

14分38秒

287_尚硅谷_集群监控_Zabbix_使用_创建监控项

440

216

6分32秒

288_尚硅谷_集群监控_Zabbix_使用_创建触发器

340

217

8分56秒

289_尚硅谷_集群监控_Zabbix_使用_创建动作

310

218

9分12秒

28_尚硅谷_用户行为采集_项目经验_配置LZO压缩

400

219

15分13秒

290_尚硅谷_集群监控_Zabbix_使用_通知媒介配置

400

220

3分30秒

291_尚硅谷_集群监控_Zabbix_使用_全流程测试

290

221

14分10秒

292_尚硅谷_集群监控_Zabbix_使用_创建模板

360

222

3分52秒

293_尚硅谷_元数据管理_Atlas_课程背景

420

223

8分15秒

294_尚硅谷_元数据管理_Atlas_课程介绍

300

224

6分40秒

295_尚硅谷_元数据管理_Atlas_架构原理

380

225

13分15秒

296_尚硅谷_元数据管理_Atlas_辅助框架安装

390

226

19分33秒

297_尚硅谷_元数据管理_Atlas_登录后配置

310

227

25分9秒

298_尚硅谷_元数据管理_Atlas_配置并启动

400

228

3分3秒

299_尚硅谷_元数据管理_Atlas_执行效果

330

229

9分20秒

29_尚硅谷_用户行为采集_项目经验_LZO创建索引

320

230

1分15秒

300_尚硅谷_中午演唱会_班主任

310

231

8分19秒

30_尚硅谷_用户行为采集_项目经验_基准测试

400

232

2分46秒

31_尚硅谷_用户行为采集_项目经验_HDFS参数调优

290

233

10分34秒

32_尚硅谷_用户行为采集_项目经验_Yarn参数调优

360

234

9分41秒

33_尚硅谷_用户行为采集_Zookeeper安装

340

235

9分27秒

34_尚硅谷_用户行为采集_Zookeeper启动停止脚本

380

236

5分10秒

35_尚硅谷_用户行为采集_项目经验_登录式Shell和非登录式Shell

290

237

8分44秒

36_尚硅谷_用户行为采集_日志生成（上）

350

238

6分42秒

37_尚硅谷_用户行为采集_日志生成（下）

400

239

5分31秒

38_尚硅谷_用户行为采集_集群日志生成启动脚本

350

240

6分33秒

39_尚硅谷_用户行为采集_集群时间同步修改脚本

330

241

3分30秒

40_尚硅谷_用户行为采集_集群所有进程查看脚本

350

242

3分54秒

41_尚硅谷_用户行为采集_Flume安装

280

243

9分17秒

42_尚硅谷_用户行为采集_项目经验_Flume组成

370

244

12分11秒

43_尚硅谷_用户行为采集_Flume采集配置（上）

360

245

11分49秒

44_尚硅谷_用户行为采集_Flume采集配置（下）

400

246

2分23秒

45_尚硅谷_用户行为采集_Flume拦截器_回顾

370

247

8分21秒

46_尚硅谷_用户行为采集_Flume拦截器_单Event

400

248

3分20秒

47_尚硅谷_用户行为采集_Flume拦截器_启动日志校验

430

249

7分32秒

48_尚硅谷_用户行为采集_Flume拦截器_事件日志校验

310

250

4分22秒

49_尚硅谷_用户行为采集_Flume拦截器_多Event

300

251

8分50秒

50_尚硅谷_用户行为采集_Flume拦截器_分类型拦截器

320

252

5分55秒

51_尚硅谷_用户行为采集_Flume手动启动

420

253

7分25秒

52_尚硅谷_用户行为采集_Flume脚本启动

380

254

7分33秒

53_尚硅谷_用户行为采集_Flume脚本停止

410

255

7分1秒

54_尚硅谷_用户行为采集_Kafka安装

250

256

5分34秒

55_尚硅谷_用户行为采集_Kafka启动停止脚本

330

257

4分52秒

56_尚硅谷_用户行为采集_Flume_Kafka通道打通

350

258

6分54秒

57_尚硅谷_用户行为采集_项目经验_Kafka压力测试

420

259

3分0秒

58_尚硅谷_用户行为采集_项目经验_Kafka机器数量计算

330

260

6分35秒

59_尚硅谷_用户行为采集_消费Flume_组件选型

280

261

13分32秒

60_尚硅谷_用户行为采集_消费Flume_配置文件说明

330

262

5分24秒

61_尚硅谷_用户行为采集_消费Flume_启动脚本小文件演示

370

263

6分21秒

62_尚硅谷_用户行为采集_消费Flume_小文件解决

340

264

3分38秒

63_尚硅谷_用户行为采集_项目经验_内存优化

390

265

9分12秒

64_尚硅谷_用户行为采集_采集通道脚本

370

266

7分29秒

65_尚硅谷_用户行为采集_生成测试数据

440

267

3分8秒

66_尚硅谷_业务数据采集_简介

320

268

7分26秒

67_尚硅谷_业务数据采集_电商理论_电商业务流程

420

269

3分30秒

68_尚硅谷_业务数据采集_电商理论_Spu_Sku

340

270

6分48秒

69_尚硅谷_业务数据采集_电商理论_电商表结构

360

271

8分31秒

70_尚硅谷_业务数据采集_电商理论_电商表详解

430

272

12分47秒

71_尚硅谷_业务数据采集_MySQL安装

380

273

5分37秒

72_尚硅谷_业务数据采集_Sqoop官网说明

340

274

8分59秒

73_尚硅谷_业务数据采集_Sqoop安装

370

275

5分29秒

74_尚硅谷_业务数据采集_MySQL中初始化表

370

276

6分39秒

75_尚硅谷_业务数据采集_业务数据生成_配置文件说明

330

277

3分32秒

76_尚硅谷_业务数据采集_生成2天业务数据

390

278

14分21秒

77_尚硅谷_业务数据采集_同步策略（上）

390

279

17分25秒

78_尚硅谷_业务数据采集_同步策略（下）

330

280

4分24秒

79_尚硅谷_业务数据采集_分析表同步策略

390

281

11分35秒

80_尚硅谷_业务数据采集_脚本中前一天时间获取

380

282

16分46秒

81_尚硅谷_业务数据采集_Sqoop参数说明

330

283

6分21秒

82_尚硅谷_业务数据采集_Sqoop参数说明_回顾

340

284

9分18秒

83_尚硅谷_业务数据采集_Sqoop脚本_具体表同步策略

380

285

10分23秒

84_尚硅谷_业务数据采集_Sqoop脚本完成

340

286

2分31秒

85_尚硅谷_业务数据采集_Sqoop脚本执行

330

287

29分2秒

86_尚硅谷_业务数据采集_20200310数据导入过程

400

288

24分11秒

87_尚硅谷_业务数据采集_20200311数据导入过程

360

289

2分1秒

88_尚硅谷_业务数据采集_数据导入成功后查看

330

290

7分48秒

89_尚硅谷_业务数据采集_Hive安装

370

291

3分11秒

90_尚硅谷_业务数据采集_Tez框架原理

320

292

3分58秒

91_尚硅谷_业务数据采集_Tez解压安装

310

293

8分0秒

92_尚硅谷_业务数据采集_Tez集成Hive

390

294

6分41秒

93_尚硅谷_业务数据采集_Tez注意事项

390

295

8分57秒

94_尚硅谷_数仓理论_课程介绍

340

296

13分57秒

95_尚硅谷_数仓理论_数仓分层及好处（上）

330

297

7分54秒

96_尚硅谷_数仓理论_数仓分层及好处（下）

360

298

3分43秒

97_尚硅谷_数仓理论_数据集市与数据仓库概念

340

299

4分14秒

98_尚硅谷_数仓理论_命名规范

450

300

8分39秒

99_尚硅谷_数仓理论_范式概念

350

266_尚硅谷_即席查询_Druid_概述

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐