文章/答案/技术大牛

发布

首页视频089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

2022-12-022022-12-02 16:02:23播放38

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V3.0/视频/089-尚硅谷-数仓建模理论-数仓分层模型之整体概述.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
呃，2.5这一节呢，是整个数据仓库当中的建模啊，这是这也标了，是绝对重点对吧？啊绝对重点，那整个数仓咱们就分层来，就说第一层我建门怎么建啊，所谓建门就是你建什么表，表当中有什么字段，对吧？啊，那第二层怎么建，第一层怎么建，咱们这么去去看啊，来先看第一层ods层，那说ods层让咱们自己去建建表，你应该怎么建呀。啊，ODI层当时干什么来着，是不是相当于一个过渡层对不对，把文件得放到表里来对不对，那你说你建表的时候应该是以谁为准呀。以以谁为准？是不是应该以咱们那个数据为准呀，对不对，你现在通过辅也好，通过coop也好，你往咱们的H上是不是导了好多数据啊，对吧？那咱们这有俩截图啊，这个呢是我们那个日志数据，这是咱们的业务数据啊，那我我把数据导到这个路径上了啊，那我是不是得建一张表或建多张表去装这个数据啊，那你这个表怎么建，是不是得完全看你这个数据是什么样的呀？
01:01
对不对，你数据什么样，我这个表就怎么建啊，那咱们举例子啊，咱们以日志为例。啊，日志表，首先我们呃日志数据导到HDFS上之后呢，咱们呃是不是只有一个路径啊，就是呃，Or date，然后机贸log，然后topic log，然后里边呢，是不是咱们一天一个路径，一天一个路径啊对不对，这是咱们那个所有的日志，那你说你要装这个日志，你说你应该建怎么去建表，考虑俩问题，一个是建几张表，第二一个呢，表里边有什么字段，先考虑第一个建几张表啊。先拿几张表。这几张。是不是就一张啊，对不对，因为你这个是不是，虽然咱们日志我们分了好几种啊，有什么这个，呃，按内容分咱们可以分五类，按结构分咱们也可以分两类，对吧，但是你要知道咱们所有的日志是不是都混杂在一块儿了呀，都在一个文件里边呢。对不对，那所以说我们就得看这个文件是什么样的文件，都在一个文件，那我建表就建几个。就一个表就是一张表啊，然后呢，一会咱们需要把这个数据呢，是不是得漏到这张表里来呀，对不对，然后呢，这张表咱们首先第一点哎明确啊，这个表的结构啊，咱这张表得干啥呀，是不是得是分区表，因为因为咱说后续一天一天的算呀，对吧，所以说这张表应该是分区表。
02:15
啊，那再有一个，咱们来看一下这张表的字段啊，你说这张表里字段咱们怎么决定啊。怎么决定？我要保留咱们的日志。然后你要知道这个文件当中咱们的数据是什么样的，是不是就是一条日志一行，一条日志一行，一条日志一行，这个文件是不是就是这样的，对不对，那我这个表应该是啥样的呀，你说。一个字段呀。就一个字段，你要知道啊，这个数据是怎么来的，数据是不是漏过来的，漏的过程是不是不会对文件进行任何的修改，里边内容还是一条数据，就是一行就一行数，就是一条日志，那所以说咱们这个表啊，其实就应该只有一个字段，那这个字段就是啥呀？就是一条完整的日志，对不对啊，那完了之后，咱们，诶从ods往DWT导的时候，再把这个日志进行解析，是不应该是这样的一个思路啊，对吧？那所以说那ods层咱们这个日志呢？哎，就是一张表。
03:11
就是一张表啊，然后呢得是分区表，那再一个呢，字段是什么？字段就是一个字段啊，一个字段就是那一条日志，嗯，就是这么去建呗，啊那这是日志，那业务数据怎么建呀，业务数据相对来说要比咱们这个日志更好理解一点，业务数据因为本身我从咱们的买搜导过来就是什么，就是结构化的对不对，是不是就已经有各种字段了呀，对不对，那你建表就好建了，第一联首先都得是分区表啊，咱们是不是都是一天一导都得分区表吧？啊，当然有一些比较特殊的，谁比较特殊啊。啊，比如说那个地区表，省份表，因为他是不是指导一次，那他有必要分区吗？没必要，我就一份嘛，就一张表就行了啊这个特殊咱就不说了啊，其他的表每根都要打，那都得是分区表啊，那完事之后呢。建哪些表啊？需要建几张表？你导过来几张表，是不是得建几张表？那表里有什么字段？
04:02
你买so个当中有什么字段，它是不是就得有什么字段呀，是不是得能够一一的对应上才行啊，是不是就这个意思，所以说那这个很好理解，咱们不再多说了，那接下来咱们说DWD啊，那DWD的话呢，我们实际上啊啊，咱们得看不同的数据，我需要做不同的处理，咱们前面讲了DWD呢，我们对ods层做数据做处理，咱们的分类去做啊两类，一类是日志，一类是关心数据库的数据，对吧？对日志来说，我们要干啥要进行。解析啊，要解析，那这个解析呢，相当于就是把那条日志字符串，咱们得给它解析成具体的字段吧，啊，因为你老是以字串的形式存在，我没法分析啊，对吧？啊，所以说咱们得知道得解析，那到底怎么个解析的逻辑，咱们现在不多说，咱们明天再后天再说啊，这日志那对于业务数据来说，咱们要干啥呀。要进行关系啊，进行维度建模啊，维度建模啊，那也就是说我们在ods层业务数据是不是有20多张表啊，那这20多张表我得给他把，其实这20多张表他现在有没有模型啊。
05:05
Ods有没有模型，它其实有模型，就是什么模型啊，就是关系模型，为啥。因是因为你从ods层倒过来的，对不对，OD不是从O点，你从那个那个MYSO倒过来的，那MYSO本身就是关系模型，那你拿过来是不是还是关系模型啊，他们之间本身就是有关联的啊，那只不过咱们这儿要做的就是将这个关系模型给它转化成哎维度模型，那其实所谓的转化成维度模型，咱们就是哎去干啥呀。你建你你你进行维度建模，其实就干啥，是不是你就得明确我要建哪些事实表对不对，我要建哪些维度表，然后呢，哪个事实表和哪个维度表之间是有关联的。是不是得明确这些东西啊啊，然后再一个呢，明确实时表当中有什么字段，维度表当中有什么，是不是就是确定这些东西啊，那这些东西怎么确定啊，哎，我们是有啊这个理论基础的啊，有理论基础什么基础啊，在这儿呢，有一个维度建模的四部曲。
06:03
选择业务过程声明力度，确认维度，确认事实啊，那咱们如果说把这四步咱们理解了，咱们做完了，那OK，你的维度模型就出来了。是这样的啊，所以说这个重点是不是就是这儿啊。维度建模重点就是它啊，别看这个东西它字少啊，但是其实还不确实不是那么好理解对吧？啊，什么叫选择一个过程，什么叫生命力度啊啊，什么叫确认维度，什么叫认实，这还还是不是那么好理解啊呃，咱们现在因为时间关系，这块就先不展开讲了，光讲这个东西，咱们就得讲这个小一节课啊，这个咱们等周一再讲吧，啊也是咱们得知道啊，这个东西就是用来帮助我们进行维度建模的。啊啊OK，那这个完事之后，咱们将对DWDDWD，咱们主要主要的工作就做完了啊，也就是日志咱们解析啊，业务呢进行维度建模啊OK，维度建模呢，咱们来用这个思想去指导我们进行建模啊，OK。
07:01
行，那DWD搞定，那接下来呢，是这个宽表层DWS和DWT啊这个宽表层呢，咱们其实前面也管它叫什么叫做汇总层，对吧？啊汇总层那大家还记得咱们这个DWS和DWT，那这两层他们之间的这个这个区别吗？还记得吗？啊对，DWS层呢，咱们是按天汇总对不对，那DWT呢，咱们是哎按照这个累积进行汇总对不对，是累计值啊这个比如最近七天啊，最近15啊，最近30等等等等，是这样的啊那OK，那接下来咱们来分析一下啊，那这两层，那我们的建表建模思想应该什么样的啊，所谓建模呢，就是还是明确那俩问题呗，啊就是建什么表，表当中的字段怎么确定，是不是就是这些这些问题啊，那它这块咱们怎么确定？啊，这个怎么做呀。啊，其实这呢有一个小场景，咱们现在可以先尝试着看一下啊，来看一看能不能看懂啊来首先这儿呢有一个小问题是吧，来这儿一个什么问题呢？看一下啊，这儿我提出一个问题，两个需求，哪俩需求啊？呃，第一个需求是统计每个省份的订单个数。
08:12
统计每个省份的订单个数。啊，那你说这个统计咱们应该怎么统计啊，如果没有宽表层，那这个应该来自于谁，来自于DWD层对吧？DW层，假如说我们的维度模型已经建出来了啊，那咱们维度模型咱们如果说要想统计这个，你说你应该去找什么试试表。是不是肯定找订单试试表，那你找什么维度表。肯定找地区纬度表对不对，那他俩是不是得进行关联，关联之后呢，对谁进行分组，对省份分组，然后呢，对谁进行聚合呀，因为是个数，个数其实说白了就是啥呀，Count一下是不是就是个数了呀，因为在订单十表当中，咱们都知道一行数据就是一个订单对不对，那你有几行是不是就是有几个订单呀，所以行数就等于个数，哎，就这么理解嘛，啊好，那这个就是咱们做这个需求的这个方式。
09:04
那诶这个做完之后呢，我又来了一个。这会让你统计什么？统计每个省份订单的总金额，那你说他我应该找哪张实时表？是不是还是订单实时表，那维度表呢，是不是还是地区维度表，那怎么统计啊，是不是还是它俩进行关联，然后呢对省份进行分组，然后呢，这次呢对金额进行求和对吧，对不对啊，你会发现这俩需求啊，其实咱们前面所做的处理都是相同的，是不是都是同一张表，同两张表进行聚合，然后按照相同的字段进行分组，呃，不是聚合是进行那个那个join嘛，就是相同的两张表进行join，然后呢对相同的字段进行分组。啊，然后呢，只不过你那个聚合函数是不一样的，对不对，那这样一来，其实你这一块就会有这个重复计算的问题了，啊，同样的数据，诶，你做了同样的处理，这就是重复计算啊，那像类似这样的场景呢，其实在我们的这个，呃，后续的需求当中，你可能会频繁的遇到，那这个很显然是对咱们这个计算资源的浪费，对吧？那咱们怎么去减少这个重复计算呢？
10:09
哎，怎么减少啊，来就是用咱们DWSDWT层的宽表去给它进行这个来减少，那怎么减少啊，来看一下啊，怎么设计咱们这个宽表能够减少重复计算呢？来看上面针对于咱们这个上述的场景，我们可以去设计一张地区宽表啊，是不是这俩需求我们重复计算了呀，那这时候我可以设计一张地区宽表。那这张地区宽表，我的主见是什么呢？主见就是地区ID。啊，这是主键定下来的对不对，那OK，我的这个，呃，其他字段是什么呢？注意啊，其他字段是所有跟地区相关的。呃，是实表的啊，这个度量值的聚合值。啊，这句话说的有点长啊啊，咱们来重新捋一下啊啊，相当于之前维度模型当中咱们是以谁为核心的呀。
11:06
维度为以谁为核心，以事实面为核心啊，到了这个宽门，这其实咱们反反转过来了，以谁为核心了，哎，对以维度为核心了啊是不是咱们主渐是维度字段了呀，是地区主键啊，地区ID是主键啊，然后呢，我其他的字段是什么，其他字段是啊，整个维度模型当中，所有跟地区维度相关的是实表的度量值的，就是那个什么金额个数，然后呢，它的什么呀，聚合值啊，它的聚合值。啊是这样的啊，那所以说这张宽表当中应该包含主建地区ID，那自段呢，有下单次数，下单金额，支付次数，支付金额，那这些是不是都是跟地区相关的呀，那我就放在这就行了，啊是这样的啊，这是地区。啊，OK，那如果说你有了这样的一张表之后啊，你想啊，你往这张表倒数去，是不是只算一次啊，那你像这样的需求是不是就不会重复计算了呀，是这样的啊，这个大家应该能够理解才行啊好，那这就是呃，咱们解决重复计算的这个问题，那这个其实设计出来的这个表啊，就是我们DWS或DWT层的表。
12:11
啊，DLSDLT其实咱们的设计思想都是这样的啊好，那接下来咱们做一个简单的总结啊，简单总结其实就是，呃，第一个问题就是建哪些表，第一个问第二个问题呢，就是表里的字段呗，啊来看一下。哪些表建哪些表呢？咱们以谁为准，在这儿是不是以维度为准了呀，对不对，就是我有哪些维度，那我就建哪些宽表。啊，这个先明确啊，咱们先这么简单过一下，后续咱们还会再详细的说的啊啊，那第二一个啊，那宽表当中的字段有什么呢？啊，是站在不同的维度去看实时表的，这次对吧？因为实时表示核心嘛，现在维度表示核心，现在啊维度表示核心啊然后呢，这里边的字段就是什么？再总结一下啊，再重复一句，就是所有跟该维度相关的事实表的度量值的聚合值。啊，就是它其他字段嘛，啊好，那这就是咱们一个总结好了，总结最后一点就是WS和DWT咱们有啥区别，WS呢，我存放的是主题对象的当天的汇总行为啊，那DWT层呢，咱们存放的是累积行为。
13:16
层就是这点区别嘛，啊啊，这就是咱们这个DWSDWT这两层要做的事儿啊，那接下来咱们看最后一层ADS层，ADS层呢，没有任何建模思想可言，ADS层就是看你后边需要什么数据了，你后边的应用要什么，哎，我就给你准备什么就行了啊这个不需要建模啊，就是存结果的，说实话说白了存结果存结果啊啊这个就完事了啊OK，那我把视频录一下。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V3.0

（86/291）

7分1秒

001-尚硅谷-数据仓库-课程介绍

390

19分57秒

002-尚硅谷-数据仓库-项目概述

350

15分4秒

003-尚硅谷-项目分析-需求分析

300

17分26秒

004-尚硅谷-项目分析-技术选型

420

11分48秒

005-尚硅谷-项目分析-数据流程设计图

370

13分25秒

006-尚硅谷-项目分析-框架版本选择

380

10分2秒

007-尚硅谷-项目分析-服务器选型

270

11分59秒

008-尚硅谷-项目分析-集群规模规划

370

20分1秒

009-尚硅谷-日志采集-埋点目标数据

560

9分50秒

010-尚硅谷-日志采集-主流埋点方式(了解)

460

12分31秒

011-尚硅谷-日志采集-日志数据结构

400

4分42秒

012-尚硅谷-日志采集-埋点数据上报时机

340

14分25秒

013-尚硅谷-日志采集-服务器准备

420

8分40秒

017-尚硅谷-日志采集-JDK配置及免密配置

370

1分48秒

018-尚硅谷-日志采集-JDK分发

370

7分30秒

019-尚硅谷-日志采集-Linux环境变量说明

420

10分24秒

020-尚硅谷-日志采集-模拟生成日志

380

7分37秒

021-尚硅谷-日志采集-模拟日志脚本

380

5分25秒

022-尚硅谷-日志采集-Hadoop部署之环境变量配置

340

19分0秒

023-尚硅谷-日志采集-Hadoop部署之核心配置

520

12分27秒

024-尚硅谷-日志采集-Hadoop部署之其余配置

370

2分43秒

025-尚硅谷-日志采集-Hadoop部署之历史服务器和日志聚集配置

390

4分23秒

026-尚硅谷-日志采集-Hadoop部署之启动及测试

470

9分17秒

027-尚硅谷-日志采集-Hadoop项目经验之多目录存储

360

8分27秒

028-尚硅谷-日志采集-Hadoop项目经验之数据均衡

300

7分30秒

029-尚硅谷-日志采集-Hadoop项目经验之LZO压缩配置

330

5分21秒

030-尚硅谷-日志采集-Hadoop项目经验之LZO压缩测试

380

9分0秒

031-尚硅谷-日志采集-Hadoop项目经验之LZO切片说明

340

8分39秒

032-尚硅谷-日志采集-Hadoop项目经验之参数调优

290

27分28秒

033-尚硅谷-日志采集-Hadoop项目经验之基准测试

360

7分39秒

034-尚硅谷-日志采集-通道设计规划

440

9分38秒

035-尚硅谷-日志采集-Zookeeper部署

270

10分52秒

036-尚硅谷-日志采集-Kafka安装

360

20分5秒

037-尚硅谷-日志采集-Kafka常用脚本

340

5分16秒

038-尚硅谷-日志采集-Kafka常用脚本补充

240

12分51秒

039-尚硅谷-日志采集-Kafka压力测试

330

9分17秒

040-尚硅谷-日志采集-Kafka机器数量与分区数量计算

430

4分31秒

041-尚硅谷-日志采集-Flume安装

400

5分21秒

042-尚硅谷-日志采集-日志采集配置方案对比

340

8分42秒

043-尚硅谷-日志采集-监控日志Flume组件选择

420

23分13秒

044-尚硅谷-日志采集-监控日志Flume配置文件

340

17分57秒

045-尚硅谷-日志采集-监控日志Flume拦截器编码

430

12分7秒

046-尚硅谷-日志采集-监控日志Flume测试

400

28分24秒

047-尚硅谷-日志采集-Flume启停脚本

360

10分31秒

048-尚硅谷-日志采集-消费KafkaFlume功能分析

340

2分18秒

049-尚硅谷-日志采集-消费KafkaFlume中KafkaChannel注意事项

420

37分35秒

050-尚硅谷-日志采集-消费KafkaFlume配置文件

380

9分2秒

051-尚硅谷-日志采集-消费KafkaFlume时间戳拦截器

440

9分26秒

052-尚硅谷-日志采集-消费KafkaFlume测试

390

1分21秒

053-尚硅谷-日志采集-消费KafkaFlume启停脚本

390

4分38秒

054-尚硅谷-日志采集-消费KafkaFlume内存调整

320

3分23秒

055-尚硅谷-日志采集-小结

310

12分12秒

056-尚硅谷-业务数据采集-电商系统概述

370

7分7秒

057-尚硅谷-业务数据采集-电商系统基本概念

340

7分44秒

058-尚硅谷-业务数据采集-电商系统表结构说明

370

25分1秒

059-尚硅谷-业务数据采集-电商系统核心表概述

340

15分55秒

060-尚硅谷-业务数据采集-电商系统表结构讲解

410

7分58秒

061-尚硅谷-业务数据采集-电商系统表字段说明

380

9分27秒

062-尚硅谷-业务数据采集-模拟数据生成之mysql部署

370

3分40秒

063-尚硅谷-业务数据采集-模拟数据生成之建表

350

10分23秒

064-尚硅谷-业务数据采集-模拟数据生成之EZDM使用简明介绍

410

9分39秒

065-尚硅谷-业务数据采集-模拟数据生成之测试

470

7分11秒

066-尚硅谷-业务数据采集-Sqoop概述

400

7分12秒

067-尚硅谷-业务数据采集-Sqoop安装

370

4分53秒

068-尚硅谷-业务数据采集-Sqoop测试

360

26分13秒

069-尚硅谷-业务数据采集-Sqoop基础使用

440

7分4秒

070-尚硅谷-业务数据采集-Sqoop使用之SQL形式导入

350

23分40秒

071-尚硅谷-业务数据采集-数据同步策略

340

14分33秒

072-尚硅谷-业务数据采集-业务数据表同步策略划分

360

40分18秒

073-尚硅谷-业务数据采集-Sqoop导入脚本之基础说明

310

7分33秒

074-尚硅谷-业务数据采集-Sqoop导入脚本之同步策略说明

450

2分40秒

075-尚硅谷-业务数据采集-Sqoop导入脚本之测试

350

1分35秒

076-尚硅谷-业务数据采集-Sqoop导入脚本之存在问题分析

380

3分57秒

077-尚硅谷-业务数据采集-Sqoop导入脚本之数据验证

420

34分16秒

078-尚硅谷-数仓建模理论-分层概述

440

5分48秒

079-尚硅谷-数仓建模理论-数据集市

300

7分43秒

080-尚硅谷-数仓建模理论-命名规范

390

17分1秒

081-尚硅谷-数仓建模理论-范式理论之概述

370

8分27秒

082-尚硅谷-数仓建模理论-范式理论之函数依赖

380

13分9秒

083-尚硅谷-数仓建模理论-范式理论之三范式

420

12分35秒

084-尚硅谷-数仓建模理论-OLTP与OLAP概述

420

18分6秒

085-尚硅谷-数仓建模理论-关系建模与维度建模

520

15分2秒

086-尚硅谷-数仓建模理论-维度模型之事实表与维度表

500

17分0秒

087-尚硅谷-数仓建模理论-维度模型之事实表分类

380

9分27秒

088-尚硅谷-数仓建模理论-维度模型之模型分类

490

13分41秒

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

380

4分33秒

090-尚硅谷-数仓建模理论-数仓分层模型之ODS层

380

26分1秒

091-尚硅谷-数仓建模理论-数仓分层模型之DWD层

310

30分51秒

092-尚硅谷-数仓建模理论-数仓分层模型之DWD层维度建模演示

400

11分2秒

093-尚硅谷-数仓建模理论-数仓分层模型之DWS层与DWT层

370

2分10秒

094-尚硅谷-数仓建模理论-数仓分层模型之建模驱动

430

10分34秒

095-尚硅谷-数仓环境准备-Hive安装

400

4分30秒

096-尚硅谷-数仓环境准备-Hive引擎说明

410

8分35秒

097-尚硅谷-数仓环境准备-框架兼容性问题说明

330

23分32秒

098-尚硅谷-数仓环境准备-HiveOnSpark配置

590

10分7秒

099-尚硅谷-数仓环境准备-HiveOnSpark测试

480

17分14秒

100-尚硅谷-数仓环境准备-Yarn容量调度器之并发度问题演示

400

19分38秒

101-尚硅谷-数仓环境准备-Yarn容量调度器之多队列配置

350

8分21秒

102-尚硅谷-数仓环境准备-Yarn容量调度器之提交任务指定队列

380

100

8分24秒

103-尚硅谷-数仓环境准备-DataGrip使用介绍

380

101

16分43秒

104-尚硅谷-数仓环境准备-新数据准备

350

102

11分4秒

105-尚硅谷-数仓搭建-ODS层日志表之建表语句

380

103

5分32秒

106-尚硅谷-数仓搭建-ODS层日志表之数据装载

360

104

7分58秒

107-尚硅谷-数仓搭建-ODS层日志表之装载脚本

330

105

4分33秒

108-尚硅谷-数仓搭建-扩展之Shell脚本引号总结

370

106

6分18秒

109-尚硅谷-数仓搭建-ODS层业务表之建表语句

340

107

4分28秒

110-尚硅谷-数仓搭建-ODS层业务表之装载脚本

420

108

8分8秒

111-尚硅谷-数仓搭建-DWD层日志表之数据结构回顾

400

109

7分34秒

112-尚硅谷-数仓搭建-DWD层日志表之Hive解析JSON函数说明

450

110

6分3秒

113-尚硅谷-数仓搭建-DWD层日志表之日志解析思路分析

340

111

7分26秒

114-尚硅谷-数仓搭建-DWD层日志表之启动表建表语句

330

112

9分0秒

115-尚硅谷-数仓搭建-DWD层日志表之启动表数据装载

360

113

4分28秒

116-尚硅谷-数仓搭建-DWD层日志表之页面表

380

114

9分14秒

117-尚硅谷-数仓搭建-DWD层日志表之动作表解析思路

360

115

5分42秒

118-尚硅谷-数仓搭建-回顾之explode函数使用说明

340

116

3分16秒

119-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数设计

270

117

11分16秒

120-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数说明

420

118

27分6秒

121-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(一)

380

119

8分49秒

122-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(二)

390

120

3分38秒

123-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数注意事项

300

121

6分10秒

124-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数创建

360

122

8分6秒

125-尚硅谷-数仓搭建-DWD层日志表之动作表数据装载

420

123

4分47秒

126-尚硅谷-数仓搭建-DWD层日志表之曝光表

450

124

9分8秒

127-尚硅谷-数仓搭建-DWD层日志表之错误表

400

125

9分57秒

128-尚硅谷-数仓搭建-DWD层数据装载之lzo索引文件识别问题

340

126

5分46秒

129-尚硅谷-数仓搭建-DWD层日志表之数据装载脚本

370

127

4分54秒

130-尚硅谷-数仓搭建-DWD层业务表之维度模型概述

340

128

11分5秒

131-尚硅谷-数仓搭建-DWD层业务表之商品维度表

330

129

1分50秒

132-尚硅谷-数仓搭建-DWD层业务表之优惠券维度表

430

130

11分44秒

133-尚硅谷-数仓搭建-DWD层业务表之活动维度表

350

131

3分40秒

134-尚硅谷-数仓搭建-DWD层业务表之地区维度表

450

132

16分34秒

135-尚硅谷-数仓搭建-DWD层业务表之时间维度表

340

133

19分22秒

136-尚硅谷-数仓搭建-DWD层业务表之支付事实表

380

134

7分22秒

137-尚硅谷-数仓搭建-DWD层业务表之退款事实表

300

135

9分45秒

138-尚硅谷-数仓搭建-DWD层业务表之评价事实表

390

136

7分8秒

139-尚硅谷-数仓搭建-DWD层业务表之订单明细实表建表语句

380

137

14分1秒

140-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(一)

310

138

9分26秒

141-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(二)

300

139

10分46秒

142-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(三)

290

140

7分56秒

143-尚硅谷-数仓搭建-DWD层业务表之加购与收藏事实表

390

141

10分16秒

144-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分析

390

142

7分48秒

145-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分区规划

380

143

9分35秒

146-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载思路

320

144

16分4秒

147-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载

330

145

9分53秒

148-尚硅谷-数仓搭建-DWD层业务表之订单事实表建表语句

430

146

43分22秒

149-尚硅谷-数仓搭建-DWD层业务表之订单事实表数据装载

340

147

17分10秒

150-尚硅谷-数仓搭建-DWD层业务表之拉链表概述

330

148

15分19秒

151-尚硅谷-数仓搭建-DWD层业务表之拉链表制作过程概述

350

149

17分40秒

152-尚硅谷-数仓搭建-DWD层业务表之用户维度表(一)

400

150

19分44秒

153-尚硅谷-数仓搭建-DWD层业务表之用户维度表(二)

390

151

8分10秒

154-尚硅谷-数仓搭建-DWD层业务表之数据装载脚本

340

152

28分38秒

155-尚硅谷-数仓搭建-DWS&DWT层之业务术语

360

153

14分11秒

156-尚硅谷-数仓搭建-DWS&DWT层之日期函数

380

154

7分22秒

157-尚硅谷-数仓搭建-DWS&DWT层之复杂数据类型使用说明

330

155

16分3秒

158-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表建表语句

400

156

47分40秒

159-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表数据装载

270

157

24分16秒

160-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表建表语句

310

158

6分37秒

161-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载思路分析

390

159

14分46秒

162-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(一)

390

160

29分43秒

163-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(二)

360

161

5分43秒

164-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表建表语句

330

162

13分7秒

165-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表数据装载

370

163

6分35秒

166-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表建表语句

340

164

13分45秒

167-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表初次装载说明

390

165

9分28秒

168-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表数据装载

480

166

1分20秒

169-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表建表语句

370

167

23分6秒

170-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(一)

390

168

24分27秒

171-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

430

169

9分25秒

172-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

320

170

12分3秒

173-尚硅谷-数仓搭建-DWT层之商品主题累积汇总表

400

171

20分48秒

174-尚硅谷-数仓搭建-DWS&DWT层之活动主题汇总表

430

172

16分29秒

175-尚硅谷-数仓搭建-DWS&DWT层之地区主题汇总表

430

173

7分5秒

176-尚硅谷-数仓搭建-DWS&DWT层之数据装载脚本

401

174

45分43秒

177-尚硅谷-数仓需求-设备主题之活跃设备数

350

175

4分36秒

178-尚硅谷-数仓需求-设备主题之新增&沉默&流失需求说明

330

176

6分13秒

179-尚硅谷-数仓需求-设备主题之新增设备数需求讲解

260

177

4分9秒

180-尚硅谷-数仓需求-设备主题之沉默用户数需求讲解

380

178

2分51秒

181-尚硅谷-数仓需求-设备主题之流失用户数需求讲解

370

179

8分5秒

182-尚硅谷-数仓需求-设备主题之留存率需求说明

430

180

2分2秒

183-尚硅谷-数仓需求-设备主题之回流用户数需求说明(一)

430

181

2分9秒

184-尚硅谷-数仓需求-设备主题之回流用户数需求说明(二)

400

182

1分57秒

185-尚硅谷-数仓需求-设备主题之最近三周连续活跃用户数需求说明

390

183

2分15秒

186-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求说明

360

184

16分33秒

187-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路一)

420

185

8分26秒

188-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路二)

330

186

14分24秒

189-尚硅谷-数仓需求-设备主题之回流用户数需求讲解

370

187

21分0秒

190-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路一)

410

188

9分28秒

191-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路二)

410

189

20分19秒

192-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路一)

350

190

13分4秒

193-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路二)

330

191

4分44秒

194-尚硅谷-数仓需求-会员主题之会员信息统计需求说明

370

192

5分15秒

195-尚硅谷-数仓需求-会员主题之漏斗分析需求说明

390

193

1分51秒

196-尚硅谷-数仓需求-商品主题之商品个数需求说明

340

194

10分1秒

197-尚硅谷-数仓需求-会员主题之会员信息统计需求讲解

330

195

21分8秒

198-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路一)

370

196

6分16秒

199-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路二)

270

197

5分51秒

200-尚硅谷-数仓需求-商品主题之商品个数需求讲解

310

198

8分5秒

201-尚硅谷-数仓需求-商品主题之全局TopN需求说明

380

199

2分45秒

202-尚硅谷-数仓需求-商品主题之分组TopN需求说明

390

200

4分28秒

203-尚硅谷-数仓需求-商品主题之销量排行需求讲解

330

201

3分21秒

204-尚硅谷-数仓需求-商品主题之退款率排行需求讲解

390

202

2分44秒

205-尚硅谷-数仓需求-商品主题之差评率排行需求讲解

360

203

10分57秒

206-尚硅谷-数仓需求-商品主题之分组TopN需求讲解

330

204

7分32秒

207-尚硅谷-数仓需求-营销主题之下单&支付统计需求说明

350

205

9分14秒

208-尚硅谷-数仓需求-营销主题之品怕复购率需求说明

380

206

3分44秒

209-尚硅谷-数仓需求-营销主题之下单统计需求讲解

370

207

11分45秒

210-尚硅谷-数仓需求-营销主题之支付统计需求讲解

350

208

16分54秒

211-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路一)

370

209

9分18秒

212-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路二)

460

210

7分48秒

213-尚硅谷-数仓需求-ADS层数据导入脚本

400

211

14分47秒

214-尚硅谷-全流程调度-工作流程概述

360

212

11分26秒

215-尚硅谷-全流程调度-调度系统概述

400

213

7分54秒

216-尚硅谷-全流程调度-Azkaban部署模式概述

380

214

2分57秒

217-尚硅谷-全流程调度-Azkaban安装之安装包准备

380

215

5分53秒

218-尚硅谷-全流程调度-Azkaban安装之数据库准备

340

216

11分25秒

219-尚硅谷-全流程调度-Azkaban安装之Exec部署

400

217

10分6秒

220-尚硅谷-全流程调度-Azkaban安装之Web部署

470

218

7分53秒

221-尚硅谷-全流程调度-Azkaban使用之入门案例

350

219

5分30秒

222-尚硅谷-全流程调度-Azkaban使用之工作流程配置文件说明

390

220

11分22秒

223-尚硅谷-全流程调度-Azkaban使用之Yaml文件格式概述

390

221

6分34秒

224-尚硅谷-全流程调度-Azkaban使用之任务依赖配置

420

222

4分23秒

225-尚硅谷-全流程调度-Azkaban使用之自动失败重试

380

223

3分56秒

226-尚硅谷-全流程调度-Azkaban使用之手动失败重试

390

224

6分57秒

227-尚硅谷-全流程调度-Azkaban使用之定时调度

410

225

9分35秒

228-尚硅谷-全流程调度-Azkaban使用之邮件配置

470

226

4分35秒

229-尚硅谷-全流程调度-Azkaban使用之邮件通知演示

310

227

5分14秒

230-尚硅谷-全流程调度-实操之Sqoop导出功能说明

440

228

15分3秒

231-尚硅谷-全流程调度-实操之MySQL建库建表

330

229

28分36秒

232-尚硅谷-全流程调度-实操之Sqoop导出脚本

380

230

6分58秒

233-尚硅谷-全流程调度-实操之新数据准备

360

231

7分13秒

234-尚硅谷-全流程调度-实操之Azkaban启停脚本

370

232

11分9秒

235-尚硅谷-全流程调度-实操之Azkaban工作流程配置文件编写

360

233

5分22秒

236-尚硅谷-全流程调度-实操之Azkaban工作流传参说明

440

234

9分34秒

237-尚硅谷-全流程调度-实操之Azkaban全流程调度演示

360

235

8分16秒

238-尚硅谷-全流程调度-实操之Azkaban问题总结

360

236

4分45秒

239-尚硅谷-数据可视化-概述

450

237

6分22秒

240-尚硅谷-数据可视化-Superset概述

370

238

15分56秒

241-尚硅谷-数据可视化-Superset安装之Miniconda部署

520

239

9分43秒

242-尚硅谷-数据可视化-Superset安装之准备Python3.6环境

430

240

7分2秒

243-尚硅谷-数据可视化-Superset安装

530

241

5分31秒

244-尚硅谷-数据可视化-Superset安装之初始化

490

242

6分20秒

245-尚硅谷-数据可视化-Superset安装之启动

400

243

9分52秒

246-尚硅谷-数据可视化-Superset安装之启停脚本

380

244

12分40秒

247-尚硅谷-数据可视化-Superset使用之对接数据源

450

245

13分39秒

248-尚硅谷-数据可视化-Superset使用之趋势图示例

780

246

7分29秒

249-尚硅谷-数据可视化-Superset使用之地图与饼状图示例

980

247

5分17秒

250-尚硅谷-数据可视化-Superset使用之编辑仪表盘

540

248

4分46秒

251-尚硅谷-即席查询-概述

370

249

4分42秒

252-尚硅谷-即席查询-Kylin概述

370

250

38分9秒

253-尚硅谷-即席查询-Kylin前置概念

310

251

12分46秒

254-尚硅谷-即席查询-Kylin基础架构

320

252

6分35秒

255-尚硅谷-即席查询-Kylin特点

310

253

14分12秒

256-尚硅谷-即席查询-Kylin安装之HBase部署

340

254

2分30秒

257-尚硅谷-即席查询-Kylin安装之环境变量准备

380

255

13分19秒

258-尚硅谷-即席查询-Kylin安装之兼容性问题说明

380

256

4分15秒

259-尚硅谷-即席查询-Kylin启动

440

257

30分54秒

260-尚硅谷-即席查询-Kylin使用之基础用法

360

258

21分49秒

261-尚硅谷-即席查询-Kylin使用之维度表重复key问题说明

380

259

8分29秒

262-尚硅谷-即席查询-Kylin使用之查询

390

260

12分39秒

263-尚硅谷-即席查询-Kylin使用之RestAPI使用概述

260

261

9分21秒

264-尚硅谷-即席查询-Kylin使用之每日定时构建脚本

440

262

6分42秒

265-尚硅谷-即席查询-Kylin原理之基础概念回顾

330

263

8分21秒

266-尚硅谷-即席查询-Kylin原理之Cube存储原理

480

264

15分2秒

267-尚硅谷-即席查询-Kylin原理之Cube构建原理

320

265

18分0秒

268-尚硅谷-即席查询-Kylin优化之衍生维度

400

266

13分24秒

269-尚硅谷-即席查询-Kylin优化之聚合组

340

267

15分23秒

270-尚硅谷-即席查询-Kylin优化之Rowkey调整

330

268

8分51秒

271-尚硅谷-即席查询-Kylin优化之并发粒度优化

370

269

7分13秒

272-尚硅谷-即席查询-KylinBI集成之JDBC

390

270

11分47秒

273-尚硅谷-即席查询-KylinBI集成之Zeppelin

390

271

25分6秒

274-尚硅谷-即席查询-Presto概述

340

272

23分45秒

275-尚硅谷-即席查询-Presto安装之Server部署

370

273

5分56秒

276-尚硅谷-即席查询-Presto安装之命令行客户端部署

340

274

8分54秒

277-尚硅谷-即席查询-Presto安装之LZO 压缩格式说明

320

275

8分14秒

278-尚硅谷-即席查询-Presto安装之可视化客户端部署

440

276

17分31秒

279-尚硅谷-即席查询-Presto使用注意事项

390

277

13分49秒

280-尚硅谷-集群监控-Zabbix概述

460

278

7分45秒

281-尚硅谷-集群监控-Zabbix安装之服务器环境准备

310

279

12分29秒

282-尚硅谷-集群监控-Zabbix安装之yum仓库配置

350

280

2分8秒

283-尚硅谷-集群监控-Zabbix安装之下载安装

380

281

10分9秒

284-尚硅谷-集群监控-Zabbix安装之修改配置文件

310

282

2分21秒

285-尚硅谷-集群监控-Zabbix启动

330

283

3分37秒

286-尚硅谷-集群监控-Zabbix安装之web配置

320

284

5分3秒

287-尚硅谷-集群监控-Zabbix使用之术语

400

285

7分17秒

288-尚硅谷-集群监控-Zabbix使用之创建主机

360

286

13分43秒

289-尚硅谷-集群监控-Zabbix使用之配置监控项

330

287

6分13秒

290-尚硅谷-集群监控-Zabbix使用之配置触发器

350

288

3分18秒

291-尚硅谷-集群监控-Zabbix使用之配置报警媒介

380

289

7分56秒

292-尚硅谷-集群监控-Zabbix使用之配置动作

320

290

2分12秒

293-尚硅谷-集群监控-Zabbix使用之测试

430

291

12分59秒

294-尚硅谷-集群监控-Zabbix使用之模板

390

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐