文章/答案/技术大牛

发布

首页视频334-尚硅谷-数据质量管理-检测模块(上)

334-尚硅谷-数据质量管理-检测模块(上)

2022-12-022022-12-02 16:02:27播放42

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之尚品汇（电商数仓4.0）/视频/334-尚硅谷-数据质量管理-检测模块(上).mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
上一节我们已经将所有的环境都准备好了啊，那接下来我们就可以开始开发了啊，按照我们之前的分析啊，这个数据质量管理模块呢，一共分为四个子功能模块，分别是检测模块，告警模块，可视化模块以及调度模块。那现在呢，我们先从检测模块开始啊。这个模块的主要功能呢，其实就是检测数据仓库当中与数据质量相关的指标啊，并且将这个结果写到MYSQL数据库当中。啊，没错吧？啊，那按照我们之前的需求分析啊，我们需要分别统计ods层、DM层以及DWD层的相关指标啊，然后大家注意观察啊，那咱们每一层都有多个检测指标啊，而且呢，不同的层里边可能会包含相同的指标，没错吧？啊，举个例子啊，你看DWD层和dim层我们都需要去做空值检查和重复值检查。那所以啊，这里为了代码的复用啊，我们可以先分别去实现每个单一指标的检测功能，那具体的工作呢，就是为每个单一指标来分别编写一个通用的脚本啊，之后呢，在逐个编写每层的检测脚本啊，那当然呢，这个具体的工作就是根据需要调用我们刚才编写的单一指标的脚本啊，那这两部分内容分别对应于2.4的这两节啊第一节单一规则检测脚本，那这里指的就是我们刚刚提到的诶每个指标的检测脚本啊，那下面的数仓各层检测脚本，那当然它指的就是每一层的检测脚本，那每层的检测脚本呢？诶，会调用我们前面所编写的单一规则检测脚本，OK，那接下来呢，我们就来明确一下规则检测模块的具体内容啊，那首先我们需要去编写所谓的单一规则检测脚本，单一规则检测脚本呢，一共有五个啊，那分别是主键空值检测脚本主键重复值检测。
01:58
脚本啊，值域检测脚本啊，数据量环比增长检测脚本以及数据量同比增长检测脚本啊，OK，那我们再来看一下我们数仓各层的检测脚本啊，那数仓各层检测脚本呢，我们一共要写三个啊，那分别是OD层的检测脚本，那DWD层的检测脚本以及dim层的检测脚本啊好，那现在我们先从第一部分内容开始。
02:23
来我们先看第一个脚本啊，就是空ID检测脚本啊，实际上这个脚本的功能比较简单啊，那主要就是检测目标对象的空值个数啊，并且将统计结果呢，写入到my circle啊，Date supervisor数据库当中的no ID这张表中啊啊那现在呢，我们一起来看一下脚本的内容啊，那首先我们在idea当中创建一个no id.SH文件啊来右键，然后new I fail里边呢是no下游线id.SH啊，一个shell脚本啊，创建出来之后呢，我们此呢可以装一个shellscript的一个插件，相当于是啊点击就可以，那这个插件呢，可以提供啊关键字高亮以及语法提示的功能啊好，那完之后呢，我们把这个脚本的内容给它复制过来。
03:12
哎，CTRLC来放到当中。好，那在这儿呢，我需要给大家简单说明一下啊，啊就是本课程呢，主要讲解呃，数据质量管理模块的架构和功能实现的思路啊，这个并不是shell啊，或者是Python语言的技术课啊，那所以说我们相关的语法就不做过多的说明了，好那接下来我们一起看一下脚本的具体内容啊，那首先我们在这儿使用gets这个命令呢，去解析脚本的选项参数啊，那在这呢，我们能够看到啊，这个脚本支持的选项参数有杠T啊，杠D。杠C、杠X，杠X以及杠L啊，那这些选项参数代表的含义分别是什么呢？我给大家简单说一下啊，啊此处杠T代表的是检测对象的表名，杠D呢表示的是统计日期，那杠C呢表示是检测对象的列名啊，杠S呢表示的是统计指标的下限啊，而杠X表示的就是统计指标的上限啊，那杠L呢表示的就是告警级别。
04:17
那并且哎，我们此处呃，会对传入的所有的选项参数进行变历啊，并且呢，哎，分别将每个选项参数的值赋予相应的变量啊，那大家一起看一下啊，那此处呢，我们会将杠T选项的值哎赋予table变量啊，杠D选项的值呢赋予DT变量啊，那杠C选项的值那赋予Co变量啊，杠X的值赋予ma变量啊，那再往下杠X的值呢，会赋予max变量啊那继续往下走，杠L的值呢，会被赋予level变量。好，那这部分内容呢，就是对我们这个脚本的所有的选项参数的一个解析过程，那接下来我们再继续往下看啊，那下边这两行代码呢，实际上是分别对DT变量和level变量进行了非空的判断。
05:10
啊，我们具体看一下，那假如说DT变量为空，那也就是什么呀。也就是我们在调用脚本的时候呢，没有传入杠D参数，没错吧，你不传杠D参数是不是DT变量就没有值，没有值就是空对吧？那如果它为空呢？那此处就会自动计算前一天的日期对吧？Date-D减1DAY，然后呢，使用百分号F给它格式化成年月日的格式啊，然后呢，将结果赋予变量。那也就是说我们实际在调用那个脚本的时候呢，是可以不传杠D参数的，没错吧，因为在通常情况下，我们离线数仓是不是每天计算的就是前一天的指标啊，那所以说呢，在大多数情况下，我们DT变量呢，就使用它的默认值，也就是前一天的日期就可以了啊。好，那接下来我们往下看，那下面呢，是对level这个变量进行了非空的判断，那如果level变量的值为空，也就是我们在调用脚本的时候呢，没有入杠L参数啊，那这时候呢，这个level就会赋予一个默认值零，OK，那此处呢，实际上就相当于是对DT和LEVEL2个变量赋予了两个默认值啊好，那我们再继续往下看啊，那下边呢，明了两个变量，那一个呢是have DB等于J，这个J呢，实际上就是我们的数据仓库当中的库名，那下边还有一个就是have engine啊，此处呢，给它赋予的值是have，那这个have engine也就是一个查询引擎，对吧？它指的是什么的查询引擎呢？
06:38
那实际上呢，就是我们后续去统计空值的时候需要使用的计算引擎，那再往下呢，是几个与买SQL相关的参数啊，那由于啊，我们需要将最终的统计结果写入到MYQL数据库当中，所以在这儿呢，有几个必要的参数必须得配一下啊，好，我们逐个看一下啊，那分别是my user，也就是用户名对吧？在这儿呢，我使用的是root用户啊，那然后呢，是my circlel password，也就是密码啊，那再往下呢，是myl hostd，就是数据库的主机名啊，那再有呢，就是MYDB，这个呢，就是数据库的名称啊，还有一个MYTBL，这个呢，指的就是表名啊，那当然这个数据库就是我们之前创建的date supervisor这个库。
07:23
那这个表名呢，就是我们用来存储空值检测结果的no ID，然后呢，大家需要注意一下啊，就是这些参数啊，大家需要根据自己的实际情况做出相应的修改啊，这块呢重点注意一下诶，主机名，用户名以及密码啊好，那我们再往下看啊，那下边呢是一条curs的认证语句，那在这儿为什么需要认证呢？其实很简单啊，那因为一会儿啊，我们需要使用have哎，执行一条SQL语句去计算统计对象的个数啊，那又因为我们现在的hi度集群呢，启用了科S安全认证。对吧？那所以说在我们查询之前必须得进行认证才可以啊，那当然了，如果是在非安全环境下，也就是说海杜未启用科S认证的环境当中，哎，我们就无需认证了，然后呢，大家再注意观察一下啊，那此处我们认证的用户是谁？是不是就是have啊，因为have用户呢，他拥有数仓当中每一张表的访问权限，对吧？那所以说此处我们认证为haveve用户是没有任何问题的啊啊那接下来我们再往下看啊，那下边呢，其实就比较简单了啊，下边呢，就是使用have engine，也就是我们生明的haveve，对吧，Have-E去执行一条SQ语句，那当然这个SQL语句的核心逻辑就是去计算哎，我们的目标对象的空值个数啊来，我们看一下这个circle怎么写的啊，就比较简单，往后走来。
08:45
大家来看啊，那首先在这儿呢，它select，哎，COUNT1对吧，COUNT1FROM哪张表呢？From have DB里边呢？哎，Table这张表，那这个have DB是谁呀？是不是就是我们刚刚声明的啊，对吧？这就是我们数据库的那个库名，没错吧？那这个table是谁呢？其实table啊，就是我们前面通过杠T这个参数传进来的表明，对吧？那其实这张表啊，就是我们的统计对象，没错吧？啊好，那接下来我们再看一下它的过滤条件啊，这个其实才是核心的逻辑，再往后走，那后边有一个V2DT等于啊，DT变量，那当然这个DT呢，就是我们前边通过杠D参数进来的日期，没错吧？然后看后边and，诶，Column is no，对吧？这个column是谁？
09:30
啊，其实就我们通过杠C传进来的那个列名对不对？那我们来一下这个搜索的核心逻辑啊，其实很简单啊，是不是就是统计啊，Have DB这个数据库下边的table，这张表当中的DT，这个分区当中的column这个列的now值的个数啊，那这个呢，就是核心的统计逻辑，OK，那我们再往前看啊，那除了这个S语句呢，我们这儿是不是还设置了一个参数啊，对吧？这个参数上看一下set have.sell.print等于false对吧？这个参数它的作用啥呀？
10:03
哎，很简单，哎，就是是否打印表头，那如果这个参数设为啊，那我们select出来的结果里边呢，会包含两行，一行是表头，一行呢是统计结果，但在这儿呢，我们并不需要这个表头啊，咱只需要这个统计结果，那所以说在这儿呢，我们将其设为了false，那就说最终的结果里边呢，只有一个数值啊好，那完之后我们来看一下这个数值我们怎么处理的啊，好，那来看啊，这是不是用Dollar小括号将have-E这个shell命令给它括起来了呀？那大家知道这个Dollar小括号的作用是啥吗？啊，其是这个Dollar括号的作用呢，和号的作用是一样的，它会将里边诶这个上要病列的结果赋予前边的变量啊，那也就说我们将统计结果是不是赋予了result这个变量啊好，那我们再来看一下最后一部分内容啊，最后一部分内容的作用啊，其实就是将统计结果写入到MYSQL数据库当中啊来我们看一下它怎么写的啊，在这儿它使用了诶my circlel杠一啊，然后呢去执行了一条insert语句啊，最终呢，将我们的统计结果啊，以及统计对象的表明，统计对象的列名以及统计日期啊，还有统计结果的上下限以及告警级别啊，写入到了MYDB这个库下边的my circle table这张表当中，那当然就是be supervisor里边的no ID OK，那这个脚本的全部内容呢，我们就看完了啊，那最后呢，我再给大家总结一下这个脚本的逻辑啊，那首先啊，这个脚本它是一个通用。
11:34
的检测空值个数的脚本没错吧？啊，它可以根据我们传入的参数去计算数仓当中任意一张表当中的任意一个字段的空制个数，OK，那在我们使用这个脚本的时候呢？诶，我们需要给它传入一个表名啊，再传入一个列名啊，那其实就是我们的统计对象对吧？那这个脚本接入到参数之后呢，会去执行一条have的SQL语句啊，然后呢，去计算统计对象的now值的个数，最后呢，在执行一条MYSQ的SQL语句，将统计结果呢，给它写入到诶咱们MYSQL的数据库当中，OK，那这就是这个脚本的核心逻辑。
12:11
那接下来呢，我们再来看第二一个脚本啊，第二个脚本呢，是重复值检测脚本啊，那这个脚本的主要功能呢，就是计算重复值的个数啊，并且将统计结果写入到MYSQL表当中啊OK，那我们同样把这个脚本呢，先创建出来啊，那这个脚本的名字呢，叫做duty k.SH那现在我们先在idea当中给它创建出来啊，来我们右键，然后new啊fail。CTRLV啊好，我们把这个脚本的内容粘贴过来。来，CTRLC。CTR位，好，那现在我们一起来看一下这个脚本的具体内容啊，那其实这个脚本呢，与我们刚刚讲的no id.SH这个脚本的结构是完全一样的啊好，我们简单看一下啊，那首先呢，我们还是使用get off这个命令呢，去解析我们传入的诶参数对吧？并将每个参数呢赋予与之对应的变量啊，而且这个变量呢，跟刚才也都是一样的啊，在这儿我们就不再一个一个去看了啊好，我们继续往下走啊，那下边呢，仍然是为DT和LEVEL2个变量赋予默认值啊，那DT的默认值呢，仍然是昨天的日期啊，Le的默认值呢，仍然是零。
13:20
好，我们继续往下看啊，那下边呢，哎，同样是声明了两个变量，分别是have DB等于j ma，然后have engine等于have啊，然后再往下，那下边呢，还是与my circlel相关的几个参数啊，那分别是用户名、密码，主机名啊，数据库名以及表名，然后要注意的一点是啊，那这个表名是duplicate对吧？啊好，那接下来我们往下走，那下边呢，仍然是curs的认证语句啊那再往下呢，诶，还是使用have-E去执行一个SQ语句，那只不过呢，这次我们统计的是重复值的个数对吧？啊好，那现在呢，我们来看一下这个重复值统计的逻辑是什么啊来，往后走，我们来看这儿啊，那这儿呢，我们嵌套了一个子查询，对吧？那现在我们先看最内层这个circle啊来，最内层这个circle呢，是这样写的，我来选中看一下啊，那首先是不是select啊，完之后呢，From对吧，From哪张表，From have DB啊里边的table这张表，那have DB呢，就是我们前面声明的j ma，那table呢，就是我们。
14:20
的表名对吧？然后VDT等于Dollar dt，那这个呢，就是我们传进来的日期对吧？然后Dollar column对吧？那这是按谁分组，是不是按照我们传进来的那个列进行分组啊，没错吧，那分完组之后，你看他做了一个什么操作，是不是用having做了一个过滤啊对吧？过滤条件是什么？大家看是不是count Dollar column大于一啊对吧？那这个circle呢，其实不难理解啊，来我们简单看一下啊，那首先在这儿呢，我们按照column这个列进行分组对吧？啊，那他会把什么样的数据分到一组？他是不是会把该列值相同的行分到同一组当中？没错吧，啊，完了之后呢，又对每一组进行了一个count统计，那count统计呢，是不是就是统计一下诶，每一组一共有多少行啊对吧，然后呢，使用having can't大于一这样的一个过滤条件去把什么样的组过滤出来。
15:13
是不是去把那个超过两行的组过滤出来啊，对吧，那超过两行就意味着啥？意味着这一组它是有重复值的。没错吧，啊OK，那前面呢，我们要把这个呃，Column给它选择出来了，那也就是我们这儿选择出来的数据就是重复的值。那当然在这儿呢，我们要统计的不是具体的重复值有谁，而是一共有多少个重复值，对吧？那所以外边呢，我们又来了一层这个查询，对不对，是不是直接select count1from咱们里边这个子查询啊，没错吧，那也是我们这儿得到这个COUNT1的结果，就是重复值的个数啊，OK啊，那我们继续往下进行啊，那外边呢，是不是又使用do小括号去获取了have-E这个shell命令的结果呀，对吧？然后呢，将这个结果赋予了前面的result变量。
16:01
啊，那最后呢，还是使用MY杠一啊，将我们的统计结果写入到目标表当中，那当然咱们现在的目标表呢，就是date supervisor库下边的duplicate表啊OK，那这就是duplicate.sh这个脚本的全部内容啊最后呢，我们再来总结一下这个脚本的逻辑啊，那首先这个脚本呢，它也是一个通用的脚本啊，当然呢，是用来计算重复值个数的一个脚本啊啊OK，那它呢，可以根据我们传入的参数啊，去统计任意一张表当中的任意一个字段的重复值个数啊那当然啊，在我们去使用这个脚本的时候呢，我们需要给它传入一个表名啊，然后呢，再传入一个诶列名啊，那OK，那他拿到我们传的参数之后呢，呃，就会去执行一个函数语句去统计啊目标对象的重复值个数，那之后呢，将统计结果写入到ma serve当中，OK，那这个脚本呢，我们就讲完了，好，我们继续看下一个啊，那下一个呢是值域检测脚本啊，那值域检测脚本呢，它的。
17:01
主要内容就是计算啊，超出规定域的值的个数啊，那并且呢，将结果写入到MYL当中啊，那同样呢，我们还是先把这个脚本创建出来啊，然后再去看一下它的具体内容诶，CTRLC。哎，我们右键。然后新建一个文件啊，CTRLV啊，那现在把脚本的内容粘贴过来。啊，CTRLZ。啊，CTR位，那这个脚本的结构呢，与我们前面讲的两个脚本也是一样的啊，只不过这个脚本呢，它多增加了两个选项参数，那分别是杠A和杠B啊那这个A和B分别指代的是什么呢？那其实呢，A和B指代的就是我们规定值域的上下限啊，这个A指代的就是下限，而B呢指代就是上限，那我们呢，诶会将杠A和杠B这两个选项参数的值，那分别赋予r min和max变量啊OK，那我们继续往下走啊下边的内容跟前面都是一致的，所以在这儿呢就不再赘述了啊啊，那其实这个脚本的核心内容呢，哎，就还是啊在这儿执行的这条have的SQL语句对吧？啊那接下来我们就看一下这个SQL语句，看看它到底是如何去计算超出值域范围的记录的个数了啊，其实很简单，我们往后走来，那这条C语句呢，就是select count1from have DB这个库下边的table这张表，对吧？然后后边的过滤条件。
18:26
现呢是VDT等于Dollar dt啊，And Dollar column not between m and max啊，那这个circle其实也不难理解对吧？首先啊，它使用一个过滤条件啊，那将不在值域范围内的记录给它过滤出来对吧？那当然在这儿呢，我们要的不是具体的每条记录对不对？我们要的是啥？诶，我们要的是这样的记录一共有多少个对吧？那所以最后呢，我们直接select count1对不对？那这个COUNT1统计出来的结果就是超出值域范围的记录的个数啊好，那同样呢，是使用Dollar小括号将这个值取出来赋予result这个变量，对吧？那最后呢，哎，还使用MY杠一将我们统计出来的结果写入到目标的MYDB下面的my table这张表当中啊，那这个table呢，指的是RNG这张表。
19:19
啊，好了，那润点SH这个脚本的全部内容就说完了，那我们继续看下一个脚本啊，那下一个脚本呢，是数据量环比检测脚本啊，那这个脚本的主要功能呢，就是去计算数据量的环比增长值啊，并且呢，将结果写入到买的表当中啊，那现在我们把这个脚本创建出来，脚本名字呢，叫做day on day.sh来右键来新建文件。CTRLV啊，然后把脚本的内容拿过来。来往下。那这个脚本的结构呢，与前面的几个脚本也是一样的啊，所以在这儿呢，我们重点看一下它的核心内容就可以了，那也就是说看一下啊，它到底是如何去计算数据量的每日环比增长的啊，那在这儿呢，我们重点看一下这部分内容就可以了啊，其实它计算呢，分为三步走，首先第一步计算昨日的数据量啊，第二步呢，计算今日的数据量，那第三步呢，哎在使用哎环比增长的公式去计算环比增长的百分比。
20:18
好，那现在我们先看一下第一步啊，看看它是如何去计算昨日的数据量的，其实很简单啊，就是一条have的生数语句，来我们看一下怎么写的啊，Select count1 from啊，Have DB啊，里边的table这张表对吧？然后后边呢，过滤条件是there dt等于date at Dollar dt减一对吧？那现在这个过滤条件是不是就是DT等于前一日的日期啊，对吧？啊，那也就是说呢，哎，我会将前一日的数据过滤出来啊，对吧？然后呢，使用一个COUNT1去统计前一日的数据量没错吧？啊，那下边呢，与之对应的就是计算啊今日数据量的这个circle语句对吧？啊，这个其实也比较简单啊，是不是就是V2 DT等于Dollar dt对吧？那这个过滤条件呢，会把今日的数据过滤出来，那之后呢，使用COUNT1去计算今日的数据量啊，OK啊，那这两条circlel执行完之后呢？呃，同样会使用do小括号啊，将其统计结果取出来对吧？然后分别赋予yesterday和today这两个变。
21:18
啊，那第三步呢？诶，是不是就是利用每日环比增长的计算公式去计算增长的百分比啊，对吧？那这个公式是什么？我们来看一下啊，这个公式很简单啊，怎么做的，来看一下是不是用今日的数据量减去前一日的数据量之后呢，再去除以前一日的数据量，对吧？那这个呢，就是环比增长的计算公式啊，是这样的啊当然了，在这儿我们考虑到了一个异常情况，什么情况啊。啊，就是说昨日的数据量是不是有可能为零啊，对吧？那如果为零在这呢，我们就直接返回一个异常结果，OK，那这就是day day这个脚本的核心内容啊，其余内容呢，我们就不再赘述了啊。那接下来我们看最后一个脚本啊，那最后一个呢，是数据量同比检测脚本啊，那先回忆一下啊，什么是同比检测啊，那在这儿呢，我们做的是每周同比检测，那所谓每周同比检测呢，就是用当天的值与上周与之对应的那一天的值进行比较啊，然后呢，去观察这个数据量的增长情况啊啊，那当然这个脚本主要实现的功能呢，就是去计算我们这所提到的每周的同比增长值啊，那并将最终的结果呢写入到买思购表当中啊啊，那现在我们来看一下这个脚本的具体内容啊，首先把这个脚本创建出来。
22:38
来右键。New fail ctrl v啊，那这个脚本呢，叫做week on week对吧？啊啊，那现在把脚本的内容拿过来。TRLC来CTRLV啊呃，由于这个脚本呢，它的结构与前面所讲的脚本大致也是相同的啊，那所以在这儿呢，我们也是只看核心内容就可以了，也就是看一下它到底是如何去计算数据量的，每周同比增长的啊好，那其实我们重点要看的就是这部分内容啊，那它的计算呢，也是分为三步走啊，首先第一步啊，计算上一周的数据量，那当然这个上周的数据量具体指的是什么啊，具体指的是上周啊，与今日相对应的那一天的数据量，然后第二步计算本周的数据量，当然这个本周的数据量呢，指的就是本周今日的数据量，那最后呢，在使用同比增长的计算公式去计算增长的百分比啊好，那现在我们来看一下这三步具体是怎么做的啊，先看前两步啊，其实前两步呢，说白了还是两条词构语句对吧？好，我们来看一下它是怎么写的啊，首先我们看这个啊。
23:43
呃，来，Select count1 from，还有DB里边的table这张表对吧？那过理条件是啥物条件是不是DT等于data at Dollar dt减七啊，对吧？啊，那Dollar dt是不是就是我们传进来的这个日期，没错吧？减七，减七是不是就是上一周与这一天对应的那一天呀？完了之后呢？诶，我们使用COUNT1去计算一下上周这一天的数据量啊，没错吧？那下边与之对应的呢？哎，就是计算我们本周也就是今日的数据量对吧？怎么计算呢？看一下，首先你看过滤条件啊，过滤条件就是V尔DT等于Dollar dt对吧？那这样一来就把今天的数据量过滤出来了，之后呢，使用COUNT1去计算它的数据量，OK，那两个数据量算出来之后呢？诶，使用Dollar小括号将它的值取出来，对吧？然后呢，分别赋予last week和this week这两个变量啊，那最后呢，再使用这个计算公式去计算增长的百分比，这公式也不难啊，来看一下是不是就用本周的数据量减去上周数据量，然后呢，再去除以上周的数据量啊。
24:44
那这样一来呢，我们得到的就是数据量的每周同比增长的百分比，好，那这就是这个脚本的主要内容，那至此我们所需的五个单一规则检测脚本就全部完成了。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之尚品汇（电商数仓4.0）

（333/339）

3分50秒

001_尚硅谷-电商数仓-课程介绍

440

10分52秒

002_尚硅谷-数仓概念-数据来源

550

3分54秒

003_尚硅谷-数仓概念-项目演示

440

15分41秒

004-尚硅谷-数仓概念-总体描述

460

13分57秒

005-尚硅谷-数仓需求-需求分析

440

6分14秒

006-尚硅谷-数仓架构-选型考虑因素

410

13分30秒

007-尚硅谷-数仓架构-技术选型

400

12分38秒

008-尚硅谷-数仓架构-项目流程设计

390

10分48秒

009-尚硅谷-数仓架构-框架发行版本选择

390

4分35秒

010-尚硅谷-数仓架构-具体版本

430

8分58秒

011-尚硅谷-数仓架构-服务器选择

360

6分27秒

012-尚硅谷-数仓架构-集群规模

450

6分9秒

013-尚硅谷-数仓架构-集群资源规划设计

430

6分25秒

014-尚硅谷-用户行为数据生成-页面日志介绍

450

1分38秒

015-尚硅谷-用户行为数据生成-事件日志介绍

350

2分16秒

016-尚硅谷-用户行为数据生成-曝光日志介绍

420

2分27秒

017-尚硅谷-用户行为数据生成-启动及错误日志介绍

460

4分53秒

018-尚硅谷-用户行为数据生成-埋点方式

480

2分58秒

019-尚硅谷-用户行为数据生成-埋点上报时机

510

11分16秒

020-尚硅谷-用户行为数据生成-埋点日志格式

340

6分17秒

021-尚硅谷-用户行为数据生成-模板服务器说明

430

10分40秒

022-尚硅谷-用户行为数据生成-克隆三台服务器

380

2分13秒

024-尚硅谷-用户行为数据生成-集群同步脚本

380

5分17秒

025-尚硅谷-用户行为数据生成-无密登录配置

360

10分36秒

026-尚硅谷-用户行为数据生成-安装JDK

420

4分16秒

027-尚硅谷-用户行为数据生成-Linux环境变量说明

400

7分30秒

028-尚硅谷-用户行为数据生成-日志生成

430

6分49秒

029-尚硅谷-用户行为数据生成-日志生成脚本

350

2分43秒

030-尚硅谷-用户行为数据采集-xcall脚本

480

5分4秒

031-尚硅谷-用户行为数据采集-Hadoop安装

400

10分38秒

032-尚硅谷-用户行为数据采集-Hadoop配置（上）

310

6分58秒

033-尚硅谷-用户行为数据采集-Hadoop配置（下）

370

3分21秒

034-尚硅谷-用户行为数据采集-Hadoop历史服务器&日志聚集

340

2分19秒

035-尚硅谷-用户行为数据采集-Hadoop集群启动

390

2分35秒

036-尚硅谷-用户行为数据采集-Hadoop集群启停脚本

370

3分41秒

037-尚硅谷-用户行为数据采集-Hadoop存储多目录

440

3分25秒

038-尚硅谷-用户行为数据采集-Hadoop节点间数据均衡

350

3分5秒

039-尚硅谷-用户行为数据采集-Hadoop磁盘间数据均衡

320

9分4秒

040-尚硅谷-用户行为数据采集-Hadoop配置支持LZO压缩

400

6分41秒

041-尚硅谷-用户行为数据采集-Hadoop配置LZO创建索引

390

5分39秒

042-尚硅谷-用户行为数据采集-Hadoop压测环境准备

370

12分32秒

043-尚硅谷-用户行为数据采集-Hadoop压测写测试

340

2分40秒

044-尚硅谷-用户行为数据采集-Hadoop压测读测试

260

2分21秒

045-尚硅谷-用户行为数据采集-Hadoop压测MR计算

400

3分57秒

046-尚硅谷-用户行为数据采集-Hadoop的HDFS参数调优

370

2分49秒

047-尚硅谷-用户行为数据采集-Hadoop的Yarn参数调优

390

6分39秒

048-尚硅谷-用户行为数据采集-Zookeeper安装

330

5分8秒

049-尚硅谷-用户行为数据采集-Zookeeper脚本

410

10分22秒

050-尚硅谷-用户行为数据采集-Kafka安装

460

3分48秒

051-尚硅谷-用户行为数据采集-Kafka脚本

450

2分19秒

052-尚硅谷-用户行为数据采集-Kafka的API回顾

300

3分12秒

053-尚硅谷-用户行为数据采集-Kafka机器数量

430

10分30秒

054-尚硅谷-用户行为数据采集-Kafka压测环境准备

350

6分44秒

055-尚硅谷-用户行为数据采集-Kafka生产压测

310

2分58秒

056-尚硅谷-用户行为数据采集-Kafka消费压测

360

3分4秒

057-尚硅谷-用户行为数据采集-Kafka分区数

390

6分11秒

058-尚硅谷-用户行为数据采集-Flume安装

370

5分28秒

059-尚硅谷-用户行为数据采集-Flume的Source选择

340

5分15秒

060-尚硅谷-用户行为数据采集-Flume的Channel选择

250

6分0秒

061-尚硅谷-用户行为数据采集-Flume的KafkaChannel

330

15分13秒

062-尚硅谷-用户行为数据采集-Flume配置编写

350

15分15秒

063-尚硅谷-用户行为数据采集-Flume拦截器单Event

410

8分35秒

064-尚硅谷-用户行为数据采集-Flume拦截器和配置完成

300

4分28秒

065-尚硅谷-用户行为数据采集-Flume-Kafka通道打通

400

4分17秒

066-尚硅谷-用户行为数据采集-Flume脚本nohup

360

7分32秒

067-尚硅谷-用户行为数据采集-Flume脚本停止进程

370

8分50秒

068-尚硅谷-用户行为数据采集-Flume脚本完成

340

6分33秒

069-尚硅谷-用户行为数据采集-消费者Flume组件选型

300

6分50秒

070-尚硅谷-用户行为数据采集-消费者Flume零点漂移说明

340

8分20秒

071-尚硅谷-用户行为数据采集-消费者Flume配置Source

350

4分48秒

072-尚硅谷-用户行为数据采集-消费者Flume配置Channel

340

8分57秒

073-尚硅谷-用户行为数据采集-消费者Flume配置Sink

390

11分39秒

074-尚硅谷-用户行为数据采集-消费者Flume时间戳拦截器

370

7分17秒

075-尚硅谷-用户行为数据采集-消费者Flume时间戳拦截器完成

350

7分37秒

076-尚硅谷-用户行为数据采集-消费者Flume小文件问题处理

380

2分26秒

077-尚硅谷-用户行为数据采集-消费者Flume脚本完成

410

1分45秒

078-尚硅谷-用户行为数据采集-消费者Flume内存优化

370

7分3秒

079-尚硅谷-用户行为数据采集-采集通道总脚本

370

4分0秒

080-尚硅谷-用户行为数据采集-2NN的bug解决

370

7分1秒

081-尚硅谷-业务数据采集-电商业务流程

380

29分51秒

082-尚硅谷-业务数据采集-业务数据库(上)

360

19分1秒

083-尚硅谷-业务数据采集-业务数据库(中)

370

30分6秒

084-尚硅谷-业务数据采集-业务数据库(下)

360

12分5秒

085-尚硅谷-业务数据采集-安装MySQL

350

7分11秒

086-尚硅谷-业务数据采集-生成业务数据

360

9分25秒

087-尚硅谷-业务数据采集-Sqoop部署

350

20分33秒

088-尚硅谷-业务数据采集-Sqoop使用

370

11分8秒

089-尚硅谷-业务数据采集-同步策略

380

9分28秒

090-尚硅谷-业务数据采集-同步策略分析

350

14分29秒

091-尚硅谷-业务数据采集-Sqoop同步命令编写

410

19分42秒

092-尚硅谷-业务数据采集-Sqoop同步脚本

380

5分0秒

093-尚硅谷-业务数据采集-部署Hive

370

10分54秒

094-尚硅谷-数仓建模理论-数仓分层概念

360

3分48秒

095-尚硅谷-数仓建模理论-数据集市概念

420

2分52秒

096-尚硅谷-数仓建模理论-开发规范

400

2分6秒

097-尚硅谷-数仓建模理论-概述

420

5分18秒

098-尚硅谷-数仓建模理论-范式概念

470

7分27秒

099-尚硅谷-数仓建模理论-数仓概述

360

9分45秒

100-尚硅谷-数据仓库理论-三范式理论

320

100

10分56秒

101-尚硅谷-数仓建模理论-关系建模和维度建模

400

101

11分51秒

102-尚硅谷-数仓建模理论-维度表和事实表

360

102

5分36秒

103-尚硅谷-数仓建模理论-维度模型分类

320

103

6分59秒

104-尚硅谷-数仓建模理论-ODS层建模思想

420

104

8分2秒

105-尚硅谷-数仓建模理论-DIM层和DWD层建模思想

420

105

22分8秒

106-尚硅谷-数仓建模理论-DIM层和DWD层建模演示

400

106

7分31秒

107-尚硅谷-数仓建模理论-DWS层和DWT层建模思想

400

107

37秒

108-尚硅谷-数仓建模理论-ADS层建表说明

440

108

4分9秒

109-尚硅谷-数仓环境搭建-计算模式分析

350

109

4分49秒

110-尚硅谷-数仓环境搭建-Hive-on-Spark兼容性问题说明

380

110

11分36秒

111-尚硅谷-数仓环境搭建-Hive-on-Spark配置

430

111

4分13秒

112-尚硅谷-数仓环境搭建-Hive-on-Spark测试

410

112

6分1秒

113-尚硅谷-数仓环境搭建-Yarn配置

310

113

6分2秒

114-尚硅谷-数仓环境搭建-DataGrip使用说明

350

114

9分40秒

115-尚硅谷-数仓环境搭建-数据准备

450

115

6分57秒

116-尚硅谷-数仓搭建-ODS层日志表建表语句

380

116

3分44秒

117-尚硅谷-数仓搭建-ODS层日志表数据装载

300

117

6分30秒

118-尚硅谷-数仓搭建-ODS层日志表装载脚本

340

118

4分13秒

119-尚硅谷-数仓搭建-ODS层业务表建表语句

410

119

10分57秒

120-尚硅谷-数仓搭建-ODS层业务表装载脚本

370

120

9分10秒

121-尚硅谷-数仓搭建-DIM层商品维度表建表语句

410

121

11分4秒

122-尚硅谷-数仓搭建-DIM层商品维度表数据装载分析

350

122

12分37秒

123-尚硅谷-数仓搭建-DIM层商品维度表数据装载语句

420

123

4分41秒

124-尚硅谷-数仓搭建-LZO索引文件失效说明

400

124

2分32秒

125-尚硅谷-数仓搭建-DIM层优惠券维度表建表语句

350

125

3分38秒

126-尚硅谷-数仓搭建-DIM层优惠券维度表数据装载

370

126

2分26秒

127-尚硅谷-数仓搭建-DIM层活动维度表建表语句

290

127

3分41秒

128-尚硅谷-数仓搭建-DIM层活动维度表装载语句

310

128

2分42秒

129-尚硅谷-数仓搭建-DIM层地区维度表

470

129

6分43秒

130-尚硅谷-数仓搭建-DIM层时间维度表

380

130

15分19秒

131-尚硅谷-数仓搭建-拉链表概述

470

131

2分5秒

132-尚硅谷-数仓搭建-DIM层用户维度表建表语句

390

132

3分33秒

133-尚硅谷-数仓搭建-DIM层用户维度表数据装载思路

370

133

2分34秒

134-尚硅谷-数仓搭建-DIM层用户维度表首日数据装载

390

134

21分8秒

135-尚硅谷-数仓搭建-DIM层用户维度表每日数据装载

400

135

8分6秒

136-尚硅谷-数仓搭建-DIM层数据装载脚本

430

136

8分23秒

137-尚硅谷-数仓搭建-DWD层日志解析思路

340

137

3分6秒

138-尚硅谷-数仓搭建-get_json_object函数

340

138

4分1秒

139-尚硅谷-数仓搭建-DWD层启动日志表建表语句

360

139

6分47秒

140-尚硅谷-数仓搭建-DWD层启动日志表数据装载

420

140

4分42秒

141-尚硅谷-数仓搭建-DWD层页面日志表

410

141

3分10秒

142-尚硅谷-数据仓库-DWD层动作日志表建表语句

360

142

6分7秒

143-尚硅谷-数仓搭建-DWD层动作日志表数据装载思路

340

143

26分55秒

144-尚硅谷-数仓搭建-UDTF函数编码

390

144

5分24秒

145-尚硅谷-数仓搭建-UDTF函数创建

390

145

5分51秒

146-尚硅谷-数仓搭建-DWD层动作日志表数据装载

410

146

5分20秒

147-尚硅谷-数仓搭建-DWD层曝光日志表

350

147

7分30秒

148-尚硅谷-数仓搭建-DWD层错误日志表

350

148

3分3秒

149-尚硅谷-数仓搭建-DWD层数据装载脚本

360

149

5分14秒

150-尚硅谷-数仓搭建-维度建模回顾

380

150

5分36秒

151-尚硅谷-数仓搭建-DWD层评价事实表建表语句

370

151

8分38秒

152-尚硅谷-数仓搭建-DWD层评价事实表数据装载

350

152

4分6秒

153-尚硅谷-数仓搭建-DWD层订单明细事实表建表语句

360

153

16分28秒

154-尚硅谷-数仓搭建-DWD层订单明细事实表数据装载

350

154

3分13秒

155-尚硅谷-数仓搭建-DWD层退单事实建表语句

330

155

5分24秒

156-尚硅谷-数仓搭建-DWD层退单事实表数据装载

380

156

6分4秒

157-尚硅谷-数仓搭建-DWD层加购事实表

390

157

4分3秒

158-尚硅谷-数仓搭建-DWD层收藏事实表

390

158

6分7秒

159-尚硅谷-数仓搭建-DWD层优惠券领用事实表建表语句

480

159

19分1秒

160-尚硅谷-数仓搭建-DWD层优惠券领用事实表数据装载

390

160

3分9秒

161-尚硅谷-数仓搭建-DWD层支付事实表建表语句

250

161

12分11秒

162-尚硅谷-数仓搭建-DWD层支付事实表数据装载

360

162

12分30秒

163-尚硅谷-数仓搭建-DWD层退款事实表

350

163

8分33秒

164-尚硅谷-数仓搭建-DWD层订单事实表建表语句

280

164

28分49秒

165-尚硅谷-数仓搭建-DWD层订单事实表数据装载

400

165

10分59秒

166-尚硅谷-数仓搭建-DWD层数据装载脚本

360

166

3分0秒

167-尚硅谷-数仓搭建-DWS层建模回顾

310

167

10分25秒

168-尚硅谷-数仓搭建-Hive时间函数和复杂数据类型说明

360

168

8分52秒

169-尚硅谷-数仓搭建-DWS层用户主题建表语句

340

169

4分34秒

170-尚硅谷-数仓搭建-DWS层用户主题数据装载思路分析

310

170

27分26秒

171-尚硅谷-数仓搭建-DWS层用户主题首日数据装载(上)

370

171

29分0秒

172-尚硅谷-数仓搭建-DWS层用户主题首日数据装载(中)

370

172

5分49秒

173-尚硅谷-数仓搭建-DWS层用户主题首日数据装载(下)

390

173

22分52秒

174-尚硅谷-数仓搭建-DWS层用户主题每日数据装载

390

174

4分22秒

175-尚硅谷-数仓搭建-DWS层访客主题建表语句

390

175

5分52秒

176-尚硅谷-数仓搭建-新增访客判断逻辑说明

420

176

19分17秒

177-尚硅谷-数仓搭建-DWS层访客主题数据装载

430

177

3分11秒

178-尚硅谷-数仓搭建-DWS层商品主题建表语句

410

178

10分4秒

179-尚硅谷-数仓搭建-DWS层商品主题数据装载

370

179

7分31秒

180-尚硅谷-数仓搭建-DWS其余主题表结构

370

180

4分10秒

181-尚硅谷-数仓搭建-DWS数据装载脚本

370

181

4分0秒

182-尚硅谷-数仓搭建-DWT层建模思想回顾

300

182

9分21秒

183-尚硅谷-数仓搭建-DWT用户主题建表语句

380

183

27分43秒

184-尚硅谷-数仓搭建-DWT用户主题首日数据装载

380

184

24分43秒

185-尚硅谷-数仓搭建-DWT用户主题每日数据装载

390

185

3分16秒

186-尚硅谷-数仓搭建-DWT访客主题建表语句

380

186

16分23秒

187-尚硅谷-数仓搭建-DWT访客主题数据装载

360

187

11分38秒

188-尚硅谷-数仓搭建-DWT层其余主题表结构

440

188

5分39秒

189-尚硅谷-数仓搭建-DWT层数据装载脚本

390

189

6分4秒

190-尚硅谷-数仓搭建-ADS层访客统计需求说明

360

190

25分49秒

191-尚硅谷-数仓搭建-ADS层访客统计需求讲解(上)

390

191

18分9秒

192-尚硅谷-数仓搭建-ADS层访客统计需求讲解(下)

350

192

3分41秒

193-尚硅谷-数仓搭建-ADS层路径分析需求说明

420

193

20分33秒

194-尚硅谷-数仓搭建-ADS层路径分析需求讲解

380

194

2分36秒

195-尚硅谷-数仓搭建-ADS层用户统计需求说明

370

195

14分2秒

196-尚硅谷-数仓搭建-ADS层用户统计需求讲解

400

196

2分1秒

197-尚硅谷-数仓搭建-ADS层用户变动统计需求说明

420

197

7分58秒

198-尚硅谷-数仓搭建-ADS层用户变动统计需求讲解

420

198

2分20秒

199-尚硅谷-数仓搭建-ADS层漏斗分析需求说明

340

199

16分39秒

200-尚硅谷-数仓搭建-ADS层漏斗分析需求讲解

340

200

3分52秒

201-尚硅谷-数仓搭建-ADS层留存率需求说明

420

201

7分53秒

202-尚硅谷-数仓搭建-ADS层留存率需求讲解

380

202

8分8秒

203-尚硅谷-数仓搭建-ADS层商品统计

410

203

12分18秒

204-尚硅谷-数仓搭建-ADS层复购率

260

204

5分27秒

205-尚硅谷-数仓搭建-ADS层订单统计

390

205

6分10秒

206-尚硅谷-数仓搭建-ADS层各地区订单统计

330

206

12分23秒

207-尚硅谷-数仓搭建-ADS层优惠券统计

390

207

3分11秒

208-尚硅谷-数仓搭建-ADS层活动统计

380

208

2分1秒

209-尚硅谷-数仓搭建-ADS层数据装载脚本

390

209

2分56秒

210-尚硅谷-全流程调度-概述

330

210

9分43秒

211-尚硅谷-全流程调度-Azkaban概述

380

211

3分44秒

212-尚硅谷-全流程调度-Azkaban基本架构及部署模式

390

212

14分11秒

213-尚硅谷-全流程调度-Azkaban部署之数据库初始化

380

213

15分1秒

214-尚硅谷-全流程调度-Azkaban部署之ExecutorServer

380

214

12分19秒

215-尚硅谷-全流程调度-Azkaban部署之WebServer

450

215

12分8秒

216-尚硅谷-全流程调度-Azkaban使用之HelloWorld案例

320

216

15分16秒

217-尚硅谷-全流程调度-Azkaban使用之配置文件编写规则

390

217

7分56秒

218-尚硅谷-全流程调度-Azkaban使用之任务依赖案例

420

218

7分34秒

219-尚硅谷-全流程调度-Azkaban使用之自动失败重试案例

410

219

7分44秒

220-尚硅谷-全流程调度-Azkaban使用之手动失败重试案例

390

220

10分25秒

221-尚硅谷-全流程调度-Azkaban进阶之JavaProcess任务类型

360

221

6分30秒

222-尚硅谷-全流程调度-Azkaban进阶之条件工作流概述

270

222

15分12秒

223-尚硅谷-全流程调度-Azkaban进阶之条件工作流运行时参数案例

340

223

10分43秒

224-尚硅谷-全流程调度-Azkaban进阶之条件工作流预定义宏案例

380

224

6分53秒

225-尚硅谷-全流程调度-Azkaban进阶之定时调度

420

225

10分51秒

226-尚硅谷-全流程调度-Azkaban进阶之邮件报警

420

226

12分25秒

227-尚硅谷-全流程调度-Azkaban进阶之电话报警

320

227

9分42秒

228-尚硅谷-全流程调度-Azkaban进阶之多Executor模式注意事项

460

228

12分13秒

229-尚硅谷-全流程调度-工作流程图

390

229

8分19秒

230-尚硅谷-全流程调度-Mysql建库建表

380

230

14分21秒

231-尚硅谷-全流程调度-Sqoop导出脚本

350

231

4分54秒

232-尚硅谷-全流程调度-新数据准备

380

232

10分7秒

233-尚硅谷-全流程调度-实操

410

233

7分5秒

234-尚硅谷-可视化-Superset概述

410

234

12分21秒

235-尚硅谷-可视化-Superset部署之Miniconda3

350

235

7分29秒

236-尚硅谷-可视化-Superset部署之Python环境

370

236

7分54秒

237-尚硅谷-可视化-Superset部署之安装

370

237

13分25秒

238-尚硅谷-可视化-Superset部署之启停

380

238

14分25秒

239-尚硅谷-可视化-Superset使用之对接数据源

620

239

3分39秒

240-尚硅谷-可视化-Superset使用之创建仪表盘

490

240

14分35秒

241-尚硅谷-可视化-Superset使用之创建Charts

920

241

12分10秒

242-尚硅谷-可视化-Superset使用之桑基图&地图

1450

242

4分26秒

243-尚硅谷-可视化-Superset使用之仪表盘布局调整

890

243

4分53秒

244-尚硅谷-即席查询-Kylin概述

360

244

21分28秒

245-尚硅谷-即席查询-Kylin前置概念

340

245

12分10秒

246-尚硅谷-即席查询-Kylin架构-n

360

246

18分39秒

247-尚硅谷-即席查询-Kylin部署之HBase

410

247

2分49秒

248-尚硅谷-即席查询-Kylin部署之环境变量

420

248

6分58秒

249-尚硅谷-即席查询-Kylin特点

340

249

22分21秒

250-尚硅谷-即席查询-Kylin启动及问题说明

300

250

11分54秒

251-尚硅谷-即席查询-Kylin使用之对接数据源

330

251

12分38秒

252-尚硅谷-即席查询-Kylin使用之构建Model

320

252

13分8秒

253-尚硅谷-即席查询-Kylin使用之构建Cube

380

253

15分5秒

254-尚硅谷-即席查询-Kylin进阶之重复key问题

440

254

28分28秒

255-尚硅谷-即席查询-Kylin进阶之每日调度脚本

370

255

26分8秒

256-尚硅谷-即席查询-Kylin理论之Cube原理

290

256

11分9秒

257-尚硅谷-即席查询-Kylin优化之聚合组

330

257

18分47秒

258-尚硅谷-即席查询-Kylin优化之衍生维度

390

258

12分4秒

259-尚硅谷-即席查询-Kylin优化之RowKey

440

259

15分48秒

260-尚硅谷-即席查询-KylinBI集成

280

260

26分29秒

261-尚硅谷-即席查询-Presto概述

450

261

22分37秒

262-尚硅谷-即席查询-Presto部署之Server

420

262

4分54秒

263-尚硅谷-即席查询-Presto部署之命令行客户端

430

263

8分26秒

264-尚硅谷-即席查询-Presto部署之LZO说明

390

264

7分23秒

265-尚硅谷-即席查询-Presto部署之可视化客户端

340

265

15分15秒

265-尚硅谷-即席查询-Presto注意事项

430

266

10分58秒

267-尚硅谷-集群监控-Zabbix概述

300

267

6分48秒

268-尚硅谷-集群监控-Zabbix部署之准备工作

330

268

17分28秒

269-尚硅谷-集群监控-Zabbix部署之yum仓库准备

400

269

1分10秒

270-尚硅谷-集群监控-Zabbix部署之安装

380

270

19分54秒

271-尚硅谷-集群监控-Zabbix部署之配置

390

271

3分35秒

272-尚硅谷-集群监控-Zabbix使用之简介

390

272

5分29秒

273-尚硅谷-集群监控-Zabbix使用之术语

440

273

6分24秒

274-尚硅谷-集群监控-Zabbix使用之创建主机

360

274

14分1秒

275-尚硅谷-集群监控-Zabbix使用之创建监控项

370

275

6分46秒

276-尚硅谷-集群监控-Zabbix使用之创建触发器

450

276

12分43秒

277-尚硅谷-集群监控-Zabbix使用之创建动作

340

277

12分12秒

278-尚硅谷-集群监控-Zabbix使用之测试&模板

420

278

19分38秒

279-尚硅谷-集群监控-Zabbix使用之集成Grafana

350

279

9分33秒

280-尚硅谷-用户认证-Kerberos概述

530

280

19分46秒

281-尚硅谷-用户认证-Kerberos认证原理

620

281

13分31秒

282-尚硅谷-用户认证-Kerberos部署之配置

590

282

3分43秒

283-尚硅谷-用户认证-Kerberos部署之初始化数据库

480

283

7分21秒

284-尚硅谷-用户认证-Kerberos部署之创建管理员用户

480

284

6分47秒

285-尚硅谷-用户认证-Kerberos使用之数据库操作

590

285

7分52秒

286-尚硅谷-用户认证-Kerberos使用之用户认证

480

286

5分45秒

287-尚硅谷-用户认证-Kerberos集成Hadoop之创建系统用户

450

287

18分43秒

288-尚硅谷-用户认证-Kerberos集成Hadoop之创建Kerberos主体

500

288

27分34秒

289-尚硅谷-用户认证-Kerberos集成Hadoop之修改配置文件

520

289

10分41秒

290-尚硅谷-用户认证-Kerberos集成Hadoop之HTTPS协议说明

500

290

15分14秒

291-尚硅谷-用户认证-Kerberos集成Hadoop之HTTPS配置

430

291

22分43秒

292-尚硅谷-用户认证-Kerberos集成Hadoop之配置LinuxContainorExecutor

500

292

9分16秒

293-尚硅谷-用户认证-Kerberos集成Hadoop之修改本地路径权限

510

293

10分17秒

294-尚硅谷-用户认证-Kerberos集成Hadoop之启动HDFS

400

294

9分46秒

295-尚硅谷-用户认证-Kerberos集成Hadoop之修改HFDS路径权限

390

295

5分3秒

296-尚硅谷-用户认证-Kerberos集成Hadoop之启动Yarn&历史服务器

370

296

7分33秒

297-尚硅谷-用户认证-Kerberos实操之用户要求

450

297

14分15秒

298-尚硅谷-用户认证-Kerberos实操之访问HDFS

580

298

3分17秒

299-尚硅谷-用户认证-Kerberos实操之访问Yarn

370

299

22分20秒

300-尚硅谷-用户认证-Kerberos实操之Hive启用认证

480

300

4分40秒

301-尚硅谷-用户认证-Kerberos实操之HiveBeeline客户端认证

460

301

10分38秒

302-尚硅谷-用户认证-Kerberos实操之HiveDataGrip认证

400

302

21分57秒

303-尚硅谷-用户认证-Kerberos实战全流程调度之准备工作

510

303

4分55秒

304-尚硅谷-用户认证-Kerberos实战全流程调度之新数据准备

430

304

5分59秒

305-尚硅谷-用户认证-Kerberos实战全流程调度之启动Azkaban

410

305

5分48秒

306-尚硅谷-用户认证-Kerberos实战全流程调度之演示

460

306

15分17秒

307-尚硅谷-用户认证-Kerberos实战Presto之准备工作

370

307

12分38秒

308-尚硅谷-用户认证-Kerberos实战Presto之修改配置文件

470

308

10分49秒

309-尚硅谷-用户认证-Kerberos实战Presto之配置映射规则&代理用户

330

309

14分24秒

310-尚硅谷-用户认证-Kerberos实战Presto之认证测试

410

310

12分36秒

311-尚硅谷-用户认证-Kerberos实战Kylin之HBase认证

360

311

16分30秒

312-尚硅谷-用户认证-Kerberos实战Kylin之认证测试

460

312

12分14秒

313-尚硅谷-权限管理-Ranger概述

430

313

10分35秒

314-尚硅谷-权限管理-Ranger部署之用户准备

360

314

2分54秒

315-尚硅谷-权限管理-Ranger部署之数据库初始化

470

315

16分56秒

316-尚硅谷-权限管理-Ranger部署之安装RangerAdmin

540

316

10分43秒

317-尚硅谷-权限管理-Ranger部署之安装UserSynce

360

317

8分20秒

318-尚硅谷-权限管理-Ranger部署之安装Hive插件

450

318

8分56秒

319-尚硅谷-权限管理-Ranger部署之配置Hive插件-nn

320

319

9分8秒

320-尚硅谷-权限管理-Ranger使用之授权管理

310

320

8分56秒

321-尚硅谷-权限管理-Ranger理论之授权模型

470

321

24分5秒

322-尚硅谷-元数据管理-Atlas概述

330

322

13分8秒

323-尚硅谷-元数据管理-Atlas部署之Solr

340

323

19分13秒

324-尚硅谷-元数据管理-Atlas部署之集成各组件

350

324

11分29秒

325-尚硅谷-元数据管理-Atlas部署之集成Hive

380

325

2分26秒

326-尚硅谷-元数据管理-Atlas使用之启动

390

326

9分46秒

327-尚硅谷-元数据管理-Atlas使用之元数据初次导入

410

327

6分17秒

328-尚硅谷-元数据管理-Atlas使用之全流程调度

390

328

4分58秒

329-尚硅谷-元数据管理-Atlas使用之查看血缘依赖关系

520

329

3分31秒

330-尚硅谷-数据质量管理-概述

470

330

3分28秒

331-尚硅谷-数据质量管理-需求分析和功能模块

390

331

4分34秒

332-尚硅谷-数据质量管理-Python开发环境准备

390

332

6分30秒

333-尚硅谷-数据质量管理-Mysql环境准备

370

333

24分56秒

334-尚硅谷-数据质量管理-检测模块(上)

420

334

6分59秒

335-尚硅谷-数据质量管理-检测模块(下)

370

335

24分52秒

336-尚硅谷-数据质量管理-告警集成模块

370

336

29分31秒

337-尚硅谷-数据质量管理-调度模块(上)

360

337

7分40秒

338-尚硅谷-数据质量管理-调度模块(中)

380

338

20分59秒

339-尚硅谷-数据质量管理-调度模块(下)

350

339

10分50秒

340-尚硅谷-数据质量管理-可视化模块

410

334-尚硅谷-数据质量管理-检测模块(上)

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐