文章/答案/技术大牛

发布

首页视频214-尚硅谷-全流程调度-工作流程概述

214-尚硅谷-全流程调度-工作流程概述

2022-12-022022-12-02 16:02:24播放36

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V3.0/视频/214-尚硅谷-全流程调度-工作流程概述.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那一会儿呢，咱们接下来呀，要学习的这个东西呢，叫做什么呢？叫做阿兹卡班啊阿卡班首先说一下啊，这个阿兹卡班它是干什么用的，阿斯卡班，呃，或者说我们呃之前给大家提过，是不是还有一个叫做乌Z的东西啊，对吧，那像这种东西啊，他们官方都是怎么定义的呢？他们都是这样给自己定义的，都说自己叫什么呢？叫做工作流程。定时调度系统。啊，它那个如果是英文的话呢，有两个关键词，一个是work flow，一个是schedule啊，那work flow是啥意思啊，就是就是咱们所谓的工作流程啊，那scheduler呢是什么呀？就是定时调度，定时调度啊，Schedule不是那个，呃，定时的意思嘛，对吧？啊，它叫做工作流程定时调度系统啊，那定时这个概念呢，咱们大家应该都清楚，因为这个任务，咱们数仓的任务需要怎么做，每天是不是都要跑对不对，所以肯定是定时是必须的啊，那关键是这个工作流程咱们怎么理解什么叫做work flow。
01:04
啊，其实work flow呢，这个概念呢，呃还是比较这个，呃比较简单的啊，它基本上呢，有这样的两个特点，我们就可以称之为哎一个work flow啊什么样的特点呢？两个，第一个一个工作流程，它是不是肯定是由多个工作单元组成的呀？啊或者由多个工作节点组成啊，比如说这个。啊，那这就是一个工作流程吧，啊，是不是有多个工作节点呀，对不对，那再有还有一个特点，还有一个特点是什么呀，就是它一个工作流程，我多个工作节点呀，它是有前后的这个执行顺序要求的啊为什么呢？因为我两个节点，前后两个节点之间呢，是有这个依赖关系的，也就是说我必须得先把前面这个工作单元做完，我才能执行下一步。啊，能理解吧，不能跳着走啊，这是它的两个特点啊，那咱们举一个生活当中的例子啊，就举一个，咱们举一个，这个就是咱们平时自己做饭的一个例子吧，啊，我我反正是不会做啊，不知道有没有会做啊，就这样一个例子，你要想，比如说今天你想吃这个，想吃菜了，对吧，想吃西红柿炒鸡蛋啊，那你首先得干啥呀。
02:11
得先去准备食材对吧，比如说去超市你得买西红柿买鸡蛋对吧？啊，那买回来之后呢。啊，得洗一下啊，对吧，啊洗洗更健康啊得洗一下，那完之后呢，包完之后呢，不是吗？不洗不能吃对吧？啊完事呢，完事呢。嗯，就切呗，对吧，切，然后准备一下等等等等完了之后呢，是不是就可以炒了呀，那炒完之后呢，嗯，你就可看情况呗，要是如果说那个能吃就吃，吃不了就扔了，对吧？啊有这种条件对吧？这种条件啊好，那这就是一个什么东西啊，那这就是一个典型的工作流程，你看整个流程是不是有多个节点组成，而且是有强后的依赖关系的啊，你菜必须买回来你才能洗啊，必须洗了才能才能切对吧？啊是这样的一个顺序啊，这是当然是一个生物当中的例子啊，那我们现在要说的是什么呀。
03:04
是我们数仓当中的工作流程啊，那你说咱现在数仓里边的工作流程应该指的是什么呀。咱书房里的工作流程应该是啥呀？啊，其实就是从原始数据，从咱们比如说从买circleq也好，从也好，呃，从那个那个日志服务器也好，对不对，那到哪到最终的我们这个结果是不是这个从头到尾它就需要一个工作流程了，对不对啊，那所以说咱现在呢，先不去学家的卡班，这个不着急，很简单一会儿就能学会啊，咱现在干什么呢？先来看一看我们这个数仓里边的工作流程，它到底是一个什么样的东西啊来我们来看一下。啊，来画，咱们画一下呗，画图就行啊呃，我们刚才也说了，我们整个工作流程呢，要求得涉及到从头到尾对吧，那咱们就从头开始开始算啊，那时候我们从头开始算，你说哪些任务应该属于我们这个工作流程啊，啊就是所谓的工作流程，就是一会儿交，需要交给阿德卡班，需要每日定时跑的，对不对啊，哪些是属于这个流程的啊，哪些需要每日定时调度。
04:09
啊，咱们一个一个来啊，从头开始，从数据源开始，对吧？哎，Input，那我们的数据源，数据源呢，咱们有两个，一个是呃日志，一个是呃，那个业务数据啊，那我们的日志是怎么采集的呀。是用M采集的，哎，那你说咱们需要交给阿德卡文调度吗？需不需要？应该不需要吧，为什么，因为我们是一个啥呀，是一个进程。是不是一个进程啊，是不是你把那个启动，咱们现在虽然我们自己现在模拟模拟这个生产环境，我们那个数据呢，是用F导过去，然后咱们为了节省资源，是不是就把腐给停掉了呀，对吧？但实在生产环境下呢，是不是一直运行啊，啊那边只要生成我就实时采集，能理解吧，所以这个东西呢，我们是不需要调度的，那只需要把它启动之后，你让它一直运行，然后呢，那就完事了，所以它不需要调度，但是日业务数据那边呢，MYSO那边MY那边咱们是实时采集吗？
05:05
不是，我们是使用scoop是不是进行批量采集啊，对不对，那一采采一天的，那所以说他得怎么办，是不是每天都要执行，因为SCO的底层本质上就是一个MAP6次嘛，对不对，所以说一天提交一次，一天提交一次，那他是不是肯定需要调度啊，对不对，那所以说我们首先第一个任务啊，就是scoop那个脚本，那scoop那个脚本咱叫啥名来着，咱们就以名字命名吧。叫my circle to htfs吧，这是我们SCO那个脚本啊，来，你给他拿过来啊，放在这里。这是我们工作流程当中的第一个工作节点，然后呢，我们再往下翻啊好，那完了之后呢，下边呢，数据现在是不是已经到了HTFS了呀，到hfs之后是不是应该从HDFS往ods层导，那我们往ods层导的这个呃，脚本呢，咱们有俩，一个是把业务数据导到ods，一个是把日志导到ods，对吧，那我们分别叫做HDFS，然后呢，To ods啊，然后呢，DB，一个是DB。
06:07
一个DB一个log对吧，比如说这个呢，咱们先叫log来CTRLCCTRLV。先拿过来，那这个呢，我们管它叫做DB。好，这是这俩工作节点，好，那现在我们已经写了三个了啊，这每一个脚本是不是都是咱们整个流程当中的一个单元，对吧？一工单元，那问一下啊，这仨工作单元之间的依赖关系应该是什么样的？啊，有没有一赖关系，有没有首先说它他跟他们俩有关系吗？没有任何关系，但是他们俩之间是有关系的吧，对不对，那所以这个一赖关系咱们已经搞清楚了，我们画一个箭头ail来画箭头，那也就是它俩之间是有依赖关系的。好，那把这个箭头放在这儿行，那我们接着往下走啊，接着往下走，那这俩完之后呢，我们数据已经到了ods层了，对吧？到ods层之后是不是该往DWD走了呀？那DWD咱也是分着走的是吧？啊也是分着的，那咱们还分着往下来啊，那这边它叫做ods，然后呢，拖啊DWD，然后呢，是不是叫做DB对吧？那左边这个呢，应该叫做ods to dwd log。
07:20
啊，那是这样的，那他们之间的依赖关系应该是什么样的，应该比较清楚吧，是不是这个依赖于它左边那个呢，依赖于它上面那个。是不是应该是这样的一个依赖关系啊，对不对，到目前为止，其实这两条线完全没有关系，它俩是不是可以并行的走啊，对不对，可以并行的走啊，那这完之后呢，我们再接着往下走，该往DWS层导了，我们数据往DWS层导的时候呢，咱是不是就已经不再区分日志和业务了，我们就合并到一起了吧，对不对，那所以说呢，这块我们需要怎么做呀？来，往这走来一个DWD，然后呢，To DW s，没错吧，D WD to d ws啊，好，那它所依赖的任务应该是谁？
08:06
它是不是应该依赖于他们俩呀，对不对啊，因为往这一层打的时候，是不是须要用到这两门的表啊，那所以说我这个任务要想执行，那必须得等他们俩都完成之后，是不是才能执行啊，是这样的啊，那所以咱这边呢，需要有两个这个依赖关系，你需要给他拿过来。来这边放在这儿。那这个呢，我给它放到这儿。啊来。啊，这个没问题吧，啊，那到这一步之后呢，我们再接着往下走啊，那数据到了DWS了，还得往哪走，还得往DWT层走啊，我把这个箭头一块摘下来。来，那接下来就简单了啊，就单线的就DWS，然后呢，下划线to d wt啊，那到了DWT呢，我们该往哪倒了，该往ADS层导了吧，那接下来把这个往下拿，CTRLCCTRLV。那最后一个呢，就是DWT，然后呢出啊adx。啊，那这个流程是不是就从最开始的原始数据到了我们ADS层了呀？诶，这就是一个典型的工作流程啊，那当然这个工作流程目前啊，还不完整，还不完整，还差一步啊，还差哪一步呢？因为我们后续是不是需要对ADS层的结果做一个可视化的展示啊，对吧？那前面说了啊，咱们可视化展示我需要对接的是谁啊。
09:21
是不是应该是用咱们报表系统对接my circleq啊，对吧，对接关型数据库，因为对接have的话，可能延迟比较高，影响我展示的效果，对吧？那所以说我们最终需要怎么做，将ADS数据是不是还得导到my circleq里边啊，那所以这边呢，我们需要给它往下拉一下，这写什么，咱们随便起一个，比如说叫做HDFS啊，然后呢，To my circle啊，那这个脚本咱是不是还没写呀，对不对，没关系啊，这个等我们用的时候再写，那这个要想时间的话，咱们应该用用谁时间呀，Scoop没错啊，这咱们后续再做，那也是现在咱们大家看到的呢，就是一个我们数仓当中的一个完整的工作流程，当然呢，实际上一个真实的一个生产环境下，这个工作流程要比咱们这个复杂啊，主要复杂什么地方呢？咱们这儿啊，这个其杂复仓表挺多的，对吧，在整个节点，这个整个的工作流程比较简单，这是因为什么？是不是因为我们一个脚本当中就包含了好多张表啊。
10:16
你比如说这张表我就包含了20张，这一个脚本就包含了20张表，对不对，但实际上我们正常应该怎么做呀，是不是应该一一张表一个脚本，这样是比较合理的呀，这是比较合适的啊，啊或者说呃，你稍微拆开一点，比如三张表一个脚本啊，哎等等也是合理的，为什么？因为如果你不拆的话，你放在一个脚本里边，那我是不是这全是怎么执行的呀？全是串行的对吧，但其实他们有必要串行嘛，其实没必要的啊，因为同一层我基本是没有依赖关系的啊，好，这个大家把这一点能够想明白就行啊，好，那这就是我们这儿的这个所谓的工作流程啊，那下来啊，咱们这个工作流程我们明白了啊，那接下来咱们思考思考啊，就说我们为什么需要使用。
11:00
工作流程调度系统。啊，你为什么要用它。啊，为什么要用它，其实咱们得想一想，如果不用它，那我们的痛点是什么，对吧？啊，你要不用它，你哪比较难受啊。就是你提交任务的时候，你比较难受，对不对，怎么个难受法呢？你想一想啊，这个任务咱们都知道了，每天都要执行，离线入仓一天一次，对吧，这个都知道啊，那然后呢，你提交的时候得怎么办，是不是得从头开始，因为他们有依赖关系的嘛，得从头开始，那也是你需要是不是先把这个执行成功，执行成功之后呢，怎么办，得等着啥呀。得等啥，是不是得得等他完成之后，你才能提交下一个，他完成之后再提交下一个啊，依次类推对不对啊，每天你都去执行这个工作，而且这个任务一般都什么时候跑。半夜跑啊，对吧啊，那也就是说咱们还得安排一个人值夜班才行啊，是不是，那所以这个很显然是不合理的啊，那所以说我们就需要一个什么东西，需要一个工具啊，这个工具能干什么事呢？这工具呢，它能够识别我们这个工作流程，你把工作流程给他，那给他之后呢，它能判断出来你这个依赖关系，那完了之后呢，他就怎么做呀，它就能自动的帮你依次提交，先跑第一个。
12:16
他会监测这个任务，等这个任务完成之后怎么办才提交下一个。他完成之后才提交，诶下一个是不是依次往下类推呀，哎是这样的啊，那所以说呢，那这个工作流程，这个调度系统呢，对我们来说还是很有必要的啊，也是很有必要的啊。好呃，而且呢，这个工作流程一般情况下呢，它还会给我们提供一个这个定时调度的一个功能啊，定时的功能哎，以满足我们这个每天重复执行嘛，啊满足我们这个需求，那除此之外呢，其实这个工作流程调度系统呢。还都一般情况下还都有一个什么呀，可视化的功能啊，什么叫可视化呢？一会儿大家学习阿卡班的时候就会就会看到啊，它会有一个外部页面，这个外部页面呢，能够把你的工作流程给你展示出来。
13:02
然后呢，你当前执行到了什么程度，执行到了哪一步，它是能够显示出来的啊，成功的这个步骤呢，会变成绿色，正在执行的呢，哎，比如说是蓝色，失败了呢，失败的是红色，哎就是说你是不是能够清楚的看到你这个工作流程的执行进度啊，对吧？这也是比较不错的一个功能，那在除此之外呢，这种工作流程调度系统呢，一般还会给我们提供一个报警的功能。报警的功能啊，什么意思啊，那大家说我们这个任务是不是前从前到后是有依赖关系的，对吧？那假如说中间有一个失败的这个，比如说当时是没有资源了呀，或者说我这个S后写的有问题啊等等等等，不管是什么原因吧，他失败了，那他失败了你说下边能执行吗？不能执行吗？那肯定执行不了啊，因为下边是不是依赖于这个的呀，对吧？那所以说如果只要有某一个失败，是不是整个工作流程就会受影响，对不对，那所以说我我们得怎么办才好啊。你得及时解决才行，要不然明天我这儿等着用用，结果呢，你没算出来这一晚上对不对，那你就耽误我的这个使用了，那所以说应该提供一个报警的功能啊，哪个任务失败了，哎给咱们打电话也好，发邮件也好，发短信也好，哎各种途径吧，哎通知完之后呢，你得去干啥呀。
14:17
哎，对，你得起来半夜对吧，半夜起来你得去看一看哪出错了对不对，出错之后呢，你需要让它继续往下运行啊，是这样的啊，那所以说这个报警的功能也是比较重要的啊好，那这个我们把视频录一下啊，这就是我们这种，呃，所谓的工作流程这个概念，以及我们为什么要去使用这个工作流程啊，刚才又说了一下工作流程调度系统呢，哎，他给我们提供了什么样的功能啊，咱们先初步的认识一下就行啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V3.0

（211/291）

7分1秒

001-尚硅谷-数据仓库-课程介绍

390

19分57秒

002-尚硅谷-数据仓库-项目概述

350

15分4秒

003-尚硅谷-项目分析-需求分析

300

17分26秒

004-尚硅谷-项目分析-技术选型

420

11分48秒

005-尚硅谷-项目分析-数据流程设计图

370

13分25秒

006-尚硅谷-项目分析-框架版本选择

380

10分2秒

007-尚硅谷-项目分析-服务器选型

270

11分59秒

008-尚硅谷-项目分析-集群规模规划

370

20分1秒

009-尚硅谷-日志采集-埋点目标数据

560

9分50秒

010-尚硅谷-日志采集-主流埋点方式(了解)

460

12分31秒

011-尚硅谷-日志采集-日志数据结构

400

4分42秒

012-尚硅谷-日志采集-埋点数据上报时机

340

14分25秒

013-尚硅谷-日志采集-服务器准备

420

8分40秒

017-尚硅谷-日志采集-JDK配置及免密配置

370

1分48秒

018-尚硅谷-日志采集-JDK分发

370

7分30秒

019-尚硅谷-日志采集-Linux环境变量说明

420

10分24秒

020-尚硅谷-日志采集-模拟生成日志

380

7分37秒

021-尚硅谷-日志采集-模拟日志脚本

380

5分25秒

022-尚硅谷-日志采集-Hadoop部署之环境变量配置

340

19分0秒

023-尚硅谷-日志采集-Hadoop部署之核心配置

520

12分27秒

024-尚硅谷-日志采集-Hadoop部署之其余配置

370

2分43秒

025-尚硅谷-日志采集-Hadoop部署之历史服务器和日志聚集配置

390

4分23秒

026-尚硅谷-日志采集-Hadoop部署之启动及测试

470

9分17秒

027-尚硅谷-日志采集-Hadoop项目经验之多目录存储

360

8分27秒

028-尚硅谷-日志采集-Hadoop项目经验之数据均衡

300

7分30秒

029-尚硅谷-日志采集-Hadoop项目经验之LZO压缩配置

330

5分21秒

030-尚硅谷-日志采集-Hadoop项目经验之LZO压缩测试

380

9分0秒

031-尚硅谷-日志采集-Hadoop项目经验之LZO切片说明

340

8分39秒

032-尚硅谷-日志采集-Hadoop项目经验之参数调优

290

27分28秒

033-尚硅谷-日志采集-Hadoop项目经验之基准测试

360

7分39秒

034-尚硅谷-日志采集-通道设计规划

440

9分38秒

035-尚硅谷-日志采集-Zookeeper部署

270

10分52秒

036-尚硅谷-日志采集-Kafka安装

360

20分5秒

037-尚硅谷-日志采集-Kafka常用脚本

340

5分16秒

038-尚硅谷-日志采集-Kafka常用脚本补充

240

12分51秒

039-尚硅谷-日志采集-Kafka压力测试

330

9分17秒

040-尚硅谷-日志采集-Kafka机器数量与分区数量计算

430

4分31秒

041-尚硅谷-日志采集-Flume安装

400

5分21秒

042-尚硅谷-日志采集-日志采集配置方案对比

340

8分42秒

043-尚硅谷-日志采集-监控日志Flume组件选择

420

23分13秒

044-尚硅谷-日志采集-监控日志Flume配置文件

340

17分57秒

045-尚硅谷-日志采集-监控日志Flume拦截器编码

430

12分7秒

046-尚硅谷-日志采集-监控日志Flume测试

400

28分24秒

047-尚硅谷-日志采集-Flume启停脚本

360

10分31秒

048-尚硅谷-日志采集-消费KafkaFlume功能分析

340

2分18秒

049-尚硅谷-日志采集-消费KafkaFlume中KafkaChannel注意事项

420

37分35秒

050-尚硅谷-日志采集-消费KafkaFlume配置文件

380

9分2秒

051-尚硅谷-日志采集-消费KafkaFlume时间戳拦截器

440

9分26秒

052-尚硅谷-日志采集-消费KafkaFlume测试

390

1分21秒

053-尚硅谷-日志采集-消费KafkaFlume启停脚本

390

4分38秒

054-尚硅谷-日志采集-消费KafkaFlume内存调整

320

3分23秒

055-尚硅谷-日志采集-小结

310

12分12秒

056-尚硅谷-业务数据采集-电商系统概述

370

7分7秒

057-尚硅谷-业务数据采集-电商系统基本概念

340

7分44秒

058-尚硅谷-业务数据采集-电商系统表结构说明

370

25分1秒

059-尚硅谷-业务数据采集-电商系统核心表概述

340

15分55秒

060-尚硅谷-业务数据采集-电商系统表结构讲解

410

7分58秒

061-尚硅谷-业务数据采集-电商系统表字段说明

380

9分27秒

062-尚硅谷-业务数据采集-模拟数据生成之mysql部署

370

3分40秒

063-尚硅谷-业务数据采集-模拟数据生成之建表

350

10分23秒

064-尚硅谷-业务数据采集-模拟数据生成之EZDM使用简明介绍

410

9分39秒

065-尚硅谷-业务数据采集-模拟数据生成之测试

470

7分11秒

066-尚硅谷-业务数据采集-Sqoop概述

400

7分12秒

067-尚硅谷-业务数据采集-Sqoop安装

370

4分53秒

068-尚硅谷-业务数据采集-Sqoop测试

360

26分13秒

069-尚硅谷-业务数据采集-Sqoop基础使用

440

7分4秒

070-尚硅谷-业务数据采集-Sqoop使用之SQL形式导入

350

23分40秒

071-尚硅谷-业务数据采集-数据同步策略

340

14分33秒

072-尚硅谷-业务数据采集-业务数据表同步策略划分

360

40分18秒

073-尚硅谷-业务数据采集-Sqoop导入脚本之基础说明

310

7分33秒

074-尚硅谷-业务数据采集-Sqoop导入脚本之同步策略说明

450

2分40秒

075-尚硅谷-业务数据采集-Sqoop导入脚本之测试

350

1分35秒

076-尚硅谷-业务数据采集-Sqoop导入脚本之存在问题分析

380

3分57秒

077-尚硅谷-业务数据采集-Sqoop导入脚本之数据验证

420

34分16秒

078-尚硅谷-数仓建模理论-分层概述

440

5分48秒

079-尚硅谷-数仓建模理论-数据集市

300

7分43秒

080-尚硅谷-数仓建模理论-命名规范

390

17分1秒

081-尚硅谷-数仓建模理论-范式理论之概述

370

8分27秒

082-尚硅谷-数仓建模理论-范式理论之函数依赖

380

13分9秒

083-尚硅谷-数仓建模理论-范式理论之三范式

420

12分35秒

084-尚硅谷-数仓建模理论-OLTP与OLAP概述

420

18分6秒

085-尚硅谷-数仓建模理论-关系建模与维度建模

520

15分2秒

086-尚硅谷-数仓建模理论-维度模型之事实表与维度表

500

17分0秒

087-尚硅谷-数仓建模理论-维度模型之事实表分类

380

9分27秒

088-尚硅谷-数仓建模理论-维度模型之模型分类

490

13分41秒

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

380

4分33秒

090-尚硅谷-数仓建模理论-数仓分层模型之ODS层

380

26分1秒

091-尚硅谷-数仓建模理论-数仓分层模型之DWD层

310

30分51秒

092-尚硅谷-数仓建模理论-数仓分层模型之DWD层维度建模演示

400

11分2秒

093-尚硅谷-数仓建模理论-数仓分层模型之DWS层与DWT层

370

2分10秒

094-尚硅谷-数仓建模理论-数仓分层模型之建模驱动

430

10分34秒

095-尚硅谷-数仓环境准备-Hive安装

400

4分30秒

096-尚硅谷-数仓环境准备-Hive引擎说明

410

8分35秒

097-尚硅谷-数仓环境准备-框架兼容性问题说明

330

23分32秒

098-尚硅谷-数仓环境准备-HiveOnSpark配置

590

10分7秒

099-尚硅谷-数仓环境准备-HiveOnSpark测试

480

17分14秒

100-尚硅谷-数仓环境准备-Yarn容量调度器之并发度问题演示

400

19分38秒

101-尚硅谷-数仓环境准备-Yarn容量调度器之多队列配置

350

8分21秒

102-尚硅谷-数仓环境准备-Yarn容量调度器之提交任务指定队列

380

100

8分24秒

103-尚硅谷-数仓环境准备-DataGrip使用介绍

380

101

16分43秒

104-尚硅谷-数仓环境准备-新数据准备

350

102

11分4秒

105-尚硅谷-数仓搭建-ODS层日志表之建表语句

380

103

5分32秒

106-尚硅谷-数仓搭建-ODS层日志表之数据装载

360

104

7分58秒

107-尚硅谷-数仓搭建-ODS层日志表之装载脚本

330

105

4分33秒

108-尚硅谷-数仓搭建-扩展之Shell脚本引号总结

370

106

6分18秒

109-尚硅谷-数仓搭建-ODS层业务表之建表语句

340

107

4分28秒

110-尚硅谷-数仓搭建-ODS层业务表之装载脚本

420

108

8分8秒

111-尚硅谷-数仓搭建-DWD层日志表之数据结构回顾

400

109

7分34秒

112-尚硅谷-数仓搭建-DWD层日志表之Hive解析JSON函数说明

450

110

6分3秒

113-尚硅谷-数仓搭建-DWD层日志表之日志解析思路分析

340

111

7分26秒

114-尚硅谷-数仓搭建-DWD层日志表之启动表建表语句

330

112

9分0秒

115-尚硅谷-数仓搭建-DWD层日志表之启动表数据装载

360

113

4分28秒

116-尚硅谷-数仓搭建-DWD层日志表之页面表

380

114

9分14秒

117-尚硅谷-数仓搭建-DWD层日志表之动作表解析思路

360

115

5分42秒

118-尚硅谷-数仓搭建-回顾之explode函数使用说明

340

116

3分16秒

119-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数设计

270

117

11分16秒

120-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数说明

420

118

27分6秒

121-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(一)

380

119

8分49秒

122-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(二)

390

120

3分38秒

123-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数注意事项

300

121

6分10秒

124-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数创建

360

122

8分6秒

125-尚硅谷-数仓搭建-DWD层日志表之动作表数据装载

420

123

4分47秒

126-尚硅谷-数仓搭建-DWD层日志表之曝光表

450

124

9分8秒

127-尚硅谷-数仓搭建-DWD层日志表之错误表

400

125

9分57秒

128-尚硅谷-数仓搭建-DWD层数据装载之lzo索引文件识别问题

340

126

5分46秒

129-尚硅谷-数仓搭建-DWD层日志表之数据装载脚本

370

127

4分54秒

130-尚硅谷-数仓搭建-DWD层业务表之维度模型概述

340

128

11分5秒

131-尚硅谷-数仓搭建-DWD层业务表之商品维度表

330

129

1分50秒

132-尚硅谷-数仓搭建-DWD层业务表之优惠券维度表

430

130

11分44秒

133-尚硅谷-数仓搭建-DWD层业务表之活动维度表

350

131

3分40秒

134-尚硅谷-数仓搭建-DWD层业务表之地区维度表

450

132

16分34秒

135-尚硅谷-数仓搭建-DWD层业务表之时间维度表

340

133

19分22秒

136-尚硅谷-数仓搭建-DWD层业务表之支付事实表

380

134

7分22秒

137-尚硅谷-数仓搭建-DWD层业务表之退款事实表

300

135

9分45秒

138-尚硅谷-数仓搭建-DWD层业务表之评价事实表

390

136

7分8秒

139-尚硅谷-数仓搭建-DWD层业务表之订单明细实表建表语句

380

137

14分1秒

140-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(一)

310

138

9分26秒

141-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(二)

300

139

10分46秒

142-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(三)

290

140

7分56秒

143-尚硅谷-数仓搭建-DWD层业务表之加购与收藏事实表

390

141

10分16秒

144-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分析

390

142

7分48秒

145-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分区规划

380

143

9分35秒

146-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载思路

320

144

16分4秒

147-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载

330

145

9分53秒

148-尚硅谷-数仓搭建-DWD层业务表之订单事实表建表语句

430

146

43分22秒

149-尚硅谷-数仓搭建-DWD层业务表之订单事实表数据装载

340

147

17分10秒

150-尚硅谷-数仓搭建-DWD层业务表之拉链表概述

330

148

15分19秒

151-尚硅谷-数仓搭建-DWD层业务表之拉链表制作过程概述

350

149

17分40秒

152-尚硅谷-数仓搭建-DWD层业务表之用户维度表(一)

400

150

19分44秒

153-尚硅谷-数仓搭建-DWD层业务表之用户维度表(二)

390

151

8分10秒

154-尚硅谷-数仓搭建-DWD层业务表之数据装载脚本

340

152

28分38秒

155-尚硅谷-数仓搭建-DWS&DWT层之业务术语

360

153

14分11秒

156-尚硅谷-数仓搭建-DWS&DWT层之日期函数

380

154

7分22秒

157-尚硅谷-数仓搭建-DWS&DWT层之复杂数据类型使用说明

330

155

16分3秒

158-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表建表语句

400

156

47分40秒

159-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表数据装载

270

157

24分16秒

160-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表建表语句

310

158

6分37秒

161-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载思路分析

390

159

14分46秒

162-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(一)

390

160

29分43秒

163-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(二)

360

161

5分43秒

164-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表建表语句

330

162

13分7秒

165-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表数据装载

370

163

6分35秒

166-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表建表语句

340

164

13分45秒

167-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表初次装载说明

390

165

9分28秒

168-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表数据装载

480

166

1分20秒

169-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表建表语句

370

167

23分6秒

170-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(一)

390

168

24分27秒

171-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

430

169

9分25秒

172-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

320

170

12分3秒

173-尚硅谷-数仓搭建-DWT层之商品主题累积汇总表

400

171

20分48秒

174-尚硅谷-数仓搭建-DWS&DWT层之活动主题汇总表

430

172

16分29秒

175-尚硅谷-数仓搭建-DWS&DWT层之地区主题汇总表

430

173

7分5秒

176-尚硅谷-数仓搭建-DWS&DWT层之数据装载脚本

401

174

45分43秒

177-尚硅谷-数仓需求-设备主题之活跃设备数

350

175

4分36秒

178-尚硅谷-数仓需求-设备主题之新增&沉默&流失需求说明

330

176

6分13秒

179-尚硅谷-数仓需求-设备主题之新增设备数需求讲解

260

177

4分9秒

180-尚硅谷-数仓需求-设备主题之沉默用户数需求讲解

380

178

2分51秒

181-尚硅谷-数仓需求-设备主题之流失用户数需求讲解

370

179

8分5秒

182-尚硅谷-数仓需求-设备主题之留存率需求说明

430

180

2分2秒

183-尚硅谷-数仓需求-设备主题之回流用户数需求说明(一)

430

181

2分9秒

184-尚硅谷-数仓需求-设备主题之回流用户数需求说明(二)

400

182

1分57秒

185-尚硅谷-数仓需求-设备主题之最近三周连续活跃用户数需求说明

390

183

2分15秒

186-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求说明

360

184

16分33秒

187-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路一)

420

185

8分26秒

188-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路二)

330

186

14分24秒

189-尚硅谷-数仓需求-设备主题之回流用户数需求讲解

370

187

21分0秒

190-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路一)

410

188

9分28秒

191-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路二)

410

189

20分19秒

192-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路一)

350

190

13分4秒

193-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路二)

330

191

4分44秒

194-尚硅谷-数仓需求-会员主题之会员信息统计需求说明

370

192

5分15秒

195-尚硅谷-数仓需求-会员主题之漏斗分析需求说明

390

193

1分51秒

196-尚硅谷-数仓需求-商品主题之商品个数需求说明

340

194

10分1秒

197-尚硅谷-数仓需求-会员主题之会员信息统计需求讲解

330

195

21分8秒

198-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路一)

370

196

6分16秒

199-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路二)

270

197

5分51秒

200-尚硅谷-数仓需求-商品主题之商品个数需求讲解

310

198

8分5秒

201-尚硅谷-数仓需求-商品主题之全局TopN需求说明

380

199

2分45秒

202-尚硅谷-数仓需求-商品主题之分组TopN需求说明

390

200

4分28秒

203-尚硅谷-数仓需求-商品主题之销量排行需求讲解

330

201

3分21秒

204-尚硅谷-数仓需求-商品主题之退款率排行需求讲解

390

202

2分44秒

205-尚硅谷-数仓需求-商品主题之差评率排行需求讲解

360

203

10分57秒

206-尚硅谷-数仓需求-商品主题之分组TopN需求讲解

330

204

7分32秒

207-尚硅谷-数仓需求-营销主题之下单&支付统计需求说明

350

205

9分14秒

208-尚硅谷-数仓需求-营销主题之品怕复购率需求说明

380

206

3分44秒

209-尚硅谷-数仓需求-营销主题之下单统计需求讲解

370

207

11分45秒

210-尚硅谷-数仓需求-营销主题之支付统计需求讲解

350

208

16分54秒

211-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路一)

370

209

9分18秒

212-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路二)

460

210

7分48秒

213-尚硅谷-数仓需求-ADS层数据导入脚本

400

211

14分47秒

214-尚硅谷-全流程调度-工作流程概述

360

212

11分26秒

215-尚硅谷-全流程调度-调度系统概述

400

213

7分54秒

216-尚硅谷-全流程调度-Azkaban部署模式概述

380

214

2分57秒

217-尚硅谷-全流程调度-Azkaban安装之安装包准备

380

215

5分53秒

218-尚硅谷-全流程调度-Azkaban安装之数据库准备

340

216

11分25秒

219-尚硅谷-全流程调度-Azkaban安装之Exec部署

400

217

10分6秒

220-尚硅谷-全流程调度-Azkaban安装之Web部署

470

218

7分53秒

221-尚硅谷-全流程调度-Azkaban使用之入门案例

350

219

5分30秒

222-尚硅谷-全流程调度-Azkaban使用之工作流程配置文件说明

390

220

11分22秒

223-尚硅谷-全流程调度-Azkaban使用之Yaml文件格式概述

390

221

6分34秒

224-尚硅谷-全流程调度-Azkaban使用之任务依赖配置

420

222

4分23秒

225-尚硅谷-全流程调度-Azkaban使用之自动失败重试

380

223

3分56秒

226-尚硅谷-全流程调度-Azkaban使用之手动失败重试

390

224

6分57秒

227-尚硅谷-全流程调度-Azkaban使用之定时调度

410

225

9分35秒

228-尚硅谷-全流程调度-Azkaban使用之邮件配置

470

226

4分35秒

229-尚硅谷-全流程调度-Azkaban使用之邮件通知演示

310

227

5分14秒

230-尚硅谷-全流程调度-实操之Sqoop导出功能说明

440

228

15分3秒

231-尚硅谷-全流程调度-实操之MySQL建库建表

330

229

28分36秒

232-尚硅谷-全流程调度-实操之Sqoop导出脚本

380

230

6分58秒

233-尚硅谷-全流程调度-实操之新数据准备

360

231

7分13秒

234-尚硅谷-全流程调度-实操之Azkaban启停脚本

370

232

11分9秒

235-尚硅谷-全流程调度-实操之Azkaban工作流程配置文件编写

360

233

5分22秒

236-尚硅谷-全流程调度-实操之Azkaban工作流传参说明

440

234

9分34秒

237-尚硅谷-全流程调度-实操之Azkaban全流程调度演示

360

235

8分16秒

238-尚硅谷-全流程调度-实操之Azkaban问题总结

360

236

4分45秒

239-尚硅谷-数据可视化-概述

450

237

6分22秒

240-尚硅谷-数据可视化-Superset概述

370

238

15分56秒

241-尚硅谷-数据可视化-Superset安装之Miniconda部署

520

239

9分43秒

242-尚硅谷-数据可视化-Superset安装之准备Python3.6环境

430

240

7分2秒

243-尚硅谷-数据可视化-Superset安装

530

241

5分31秒

244-尚硅谷-数据可视化-Superset安装之初始化

490

242

6分20秒

245-尚硅谷-数据可视化-Superset安装之启动

400

243

9分52秒

246-尚硅谷-数据可视化-Superset安装之启停脚本

380

244

12分40秒

247-尚硅谷-数据可视化-Superset使用之对接数据源

450

245

13分39秒

248-尚硅谷-数据可视化-Superset使用之趋势图示例

780

246

7分29秒

249-尚硅谷-数据可视化-Superset使用之地图与饼状图示例

980

247

5分17秒

250-尚硅谷-数据可视化-Superset使用之编辑仪表盘

540

248

4分46秒

251-尚硅谷-即席查询-概述

370

249

4分42秒

252-尚硅谷-即席查询-Kylin概述

370

250

38分9秒

253-尚硅谷-即席查询-Kylin前置概念

310

251

12分46秒

254-尚硅谷-即席查询-Kylin基础架构

320

252

6分35秒

255-尚硅谷-即席查询-Kylin特点

310

253

14分12秒

256-尚硅谷-即席查询-Kylin安装之HBase部署

340

254

2分30秒

257-尚硅谷-即席查询-Kylin安装之环境变量准备

380

255

13分19秒

258-尚硅谷-即席查询-Kylin安装之兼容性问题说明

380

256

4分15秒

259-尚硅谷-即席查询-Kylin启动

440

257

30分54秒

260-尚硅谷-即席查询-Kylin使用之基础用法

360

258

21分49秒

261-尚硅谷-即席查询-Kylin使用之维度表重复key问题说明

380

259

8分29秒

262-尚硅谷-即席查询-Kylin使用之查询

390

260

12分39秒

263-尚硅谷-即席查询-Kylin使用之RestAPI使用概述

260

261

9分21秒

264-尚硅谷-即席查询-Kylin使用之每日定时构建脚本

440

262

6分42秒

265-尚硅谷-即席查询-Kylin原理之基础概念回顾

330

263

8分21秒

266-尚硅谷-即席查询-Kylin原理之Cube存储原理

480

264

15分2秒

267-尚硅谷-即席查询-Kylin原理之Cube构建原理

320

265

18分0秒

268-尚硅谷-即席查询-Kylin优化之衍生维度

400

266

13分24秒

269-尚硅谷-即席查询-Kylin优化之聚合组

340

267

15分23秒

270-尚硅谷-即席查询-Kylin优化之Rowkey调整

330

268

8分51秒

271-尚硅谷-即席查询-Kylin优化之并发粒度优化

370

269

7分13秒

272-尚硅谷-即席查询-KylinBI集成之JDBC

390

270

11分47秒

273-尚硅谷-即席查询-KylinBI集成之Zeppelin

390

271

25分6秒

274-尚硅谷-即席查询-Presto概述

340

272

23分45秒

275-尚硅谷-即席查询-Presto安装之Server部署

370

273

5分56秒

276-尚硅谷-即席查询-Presto安装之命令行客户端部署

340

274

8分54秒

277-尚硅谷-即席查询-Presto安装之LZO 压缩格式说明

320

275

8分14秒

278-尚硅谷-即席查询-Presto安装之可视化客户端部署

440

276

17分31秒

279-尚硅谷-即席查询-Presto使用注意事项

390

277

13分49秒

280-尚硅谷-集群监控-Zabbix概述

460

278

7分45秒

281-尚硅谷-集群监控-Zabbix安装之服务器环境准备

310

279

12分29秒

282-尚硅谷-集群监控-Zabbix安装之yum仓库配置

350

280

2分8秒

283-尚硅谷-集群监控-Zabbix安装之下载安装

380

281

10分9秒

284-尚硅谷-集群监控-Zabbix安装之修改配置文件

310

282

2分21秒

285-尚硅谷-集群监控-Zabbix启动

330

283

3分37秒

286-尚硅谷-集群监控-Zabbix安装之web配置

320

284

5分3秒

287-尚硅谷-集群监控-Zabbix使用之术语

400

285

7分17秒

288-尚硅谷-集群监控-Zabbix使用之创建主机

360

286

13分43秒

289-尚硅谷-集群监控-Zabbix使用之配置监控项

330

287

6分13秒

290-尚硅谷-集群监控-Zabbix使用之配置触发器

350

288

3分18秒

291-尚硅谷-集群监控-Zabbix使用之配置报警媒介

380

289

7分56秒

292-尚硅谷-集群监控-Zabbix使用之配置动作

320

290

2分12秒

293-尚硅谷-集群监控-Zabbix使用之测试

430

291

12分59秒

294-尚硅谷-集群监控-Zabbix使用之模板

390

214-尚硅谷-全流程调度-工作流程概述

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐