文章/答案/技术大牛

发布

首页视频003-尚硅谷-项目分析-需求分析

003-尚硅谷-项目分析-需求分析

2022-12-022022-12-02 16:02:23播放30

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商数仓项目（含2.0、3.0版本）/尚硅谷数仓项目实战V3.0/视频/003-尚硅谷-项目分析-需求分析.wmv

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那我们要做一个项目的时候呢，我们首先得有得得得有什么呀，得有这个需求分析，咱们整个项目得得去用咱们的需求去驱动是吧？那现在咱们打开咱们的一个PPT，就是项目需求分析，来看这里边儿咱们有哪些需求啊。来首先第一个啊，用户行为采集平台啊，因为咱们数仓我需要去分析数据，对吧，那数据得能够采集过来才行，那咱们的数据来源呢，两个两个一个是用户行为日志，一个是业务系统里边的数据库，这两个数据来源，所以说我们应该搭两个采集平台，一个是专门用来采集用户行为的啊，那一个呢，是专门用来采集业务数据，这个所谓的业务数据呢，指的就是数据库里边那个啊，啊比如说用户的信息，订单支付加购车的信息，哎，咱们从这里边去采集，好，那现在往下走。来数据仓库之维度建模，呃，然后咱们数仓里边，前面讲过要进行这个模型的构建，对吧？那我们数仓里边主要的模型呢，就是哎维度模型啊，就是维度模型，维度模型这个呃，概念呢，是对数仓来说是非常重要的，是非常重要的啊，那所以说我们到时候会重点讲解这个维度建模，当然这得是后边的内容了啊好，再往下走。
01:19
啊，那下边呢，是我们的一些这个需求啊，一些需求，呃，因为咱们后续的数仓和后续数仓后续的应用呢，我们在这只涉及到了一个报表系统，对吧？那报表系统要展示的就是我们各种各样的指标啊，那咱们这指标有什么呢？呃，有以下几个主题啊，比如说呃，设备主题，或者叫做访客主题，访客主题这个是什么？是会员主题啊，商品主题，地区主题，活动主题等等等等，这个都是咱们一些电商的核心主题啊，在这儿呢，我们要明确一下啊，咱们这个数据仓库，咱们的业务系统是一个什么呢？是一个电商系统，那所以说我们分析的指标都是跟电商相关的啊啊，那现在往下走统计的这个报表呢，接近呃100个，呃其实到不了啊，但是大几十个是没问题的啊，大几十个没问题啊，完全对比这个什么中心公司啊，这个咱往下走。
02:12
那再往下呢，我们会给大家讲几个这个即席查询工具来进行这个指标的及析分析啊，这个及席查询啊，这也是我们这个数据分析当中的一个概念啊，那这个所谓的集析查询咱们怎么理解啊，啊是这样，大家想想我们比如说呃，前面这些啊，这些指标啊，大家说我这些指标啊，啊举个简单例子啊，比如什么指标，比如说我每天的呃，用户活跃的个数，就是日活啊，每天的这个呃，这个新增用户的个数，新增对不对，留存等等的各种各样的指标，大家想一想，你说这些指标它是不是每天的计算逻辑都是固定的呀？对不对，我日活我我每天都这么求，只不过你的数据每天数据来源，呃数据每天的数据是不一样的，对不对，那新增也都是一样的计算逻辑啊，所以说对于咱们上述所讲的这些指标呢，它都是固定的逻辑，固定的逻辑，那我们是不是这个，呃，那个分析的circle就能写死啊对不对，写死在我们收藏里边，每天进行统一的计算就行了啊，都是重复的计算啊，然后但是我们在这个分析的时候呢，我们还会有另外的一些指标啊，那这些指标呢，它不能提前预知，它不是固定的。
03:23
啊，可能我的这个数据分析师啊，我需要进行各种各样的这个数据分析对比对不对，那所以说他分析的思路你能提前知道吗？你不知道对不对，那所以说这些分析呢，是不固定的啊呃，而且这样的分析一般情况下还有一个样的要求，什么要求呢？响应得快，我数据分析嘛，对不对，我我我我想看一下这两条数据之间的关系，那我得希望他立马能够返回结果，然后我看这个结果，诶，嗯，看不出来什么，对吧，我可能还需要再做另外的分析，那我我还得再写个四号，然后再快速的出结果，也就是这种分析呢，我要求我这个速度也快。
04:00
啊，那所以说呃，所谓的集析查询指的就是咱们刚才提到的这种啊，就是说第一点，哎，我的呃需求呢，是不固定的，其次呢，我响应我要求得快啊，那这样的要求，这样的需求呢，我需要借助一些咱们专门用来进行及其查询的工具，那这种工具的特点就是延迟低，速度快啊，那这样的工具我们到时候会给大家降几个，比如说呃，后续会讲到什么麒麟啊，会讲到什么presal，这都是一些常用的及时查询工具。啊啊，当然这个东西，呃，听着这个概念很陌生，但其实咱们做起来很简单，对吧，就是啥，就是写circle呗，对不对，只不过你那个circle呢，可能会各种各样的circle啊好，那再往下走。下边啊，我们整个数仓搭起来，到时候大家会发现啊，咱们整个集群需要起很多的进程，对不对，包括我的采集，包括我的这个数仓啊，对吧，会起很多的进程，那这么多的进程，如果说任意一个进程出现问题挂掉了，那是不都有可能会对咱们的出仓造成一定的影响啊，对不对，那我们这种情况我们得呃想办法去应对才可以，那所以咱们需要怎么做呀，需要监控整个集群。
05:10
啊，一旦哪个进程挂掉了，他得立马给我干啥才行。报警才可以对吧，那报警的方式多种多样，可以打电话发短信对不对，那当然这个都得花钱啊，打电话发短信的一般都得借助第三方的服务，需要付费的，比如说一条短信多少钱，一个电话多少钱，对吧？那我们更多的还有什么，还有免费的，免费的啥呀。邮件啊，对吧，这其实我们更常用的一种啊，就是邮件通知这个免费嘛，一般都是啊是这样的，当然通知形式不重要，但是我们得有一个这样监控的一个东西，得监控整个出问题报警啊，这是呃咱们呃这个集群监控啊，这一步咱们需要去做，再往下呢。这里边儿有一个这个原数据管理这样的一个概念啊，原数据管理，那所谓的原数据管理指的是什么呢。所以语言数据大家都知道是什么啊，这个语言数据在我们数仓里边指的就是谁呀。
06:03
就是have的原数据，因为咱出仓的主体就是啥，就是have啊，Have里边一大堆的表，对不对啊，大家想想啊，如果说呃，让你现在让让咱们自己啊，让们自己来进一个新公司对不对，进个新新公司之后，你进去之后发现数仓已经搭建起来了，那数仓里边就是是不是就是一大堆乱七八糟的表啊，对不对，那现在假如说呃，我现在进来之后，你的这个领导就给你呃布置需求了啊，你去干什么，干嘛来个需求。那时候肯定当场就很懵很懵，那什么是吧，很懵，为什么？因为一大堆的表，你根本都不知道每张表是干什么的，每张表跟每张表之间的关系是什么样的，你根本就不知道，对吧？那时候会呃很难，就是说呃就是说开始一个新的项，呃很难去呃去做第一个需求啊，很难啊，那所以说呃既然有这样的情况，那我们就可以利用什么呀，利用我们的have的原数据去做一些工作。啊，做一些什么样的工作呢？因为have，原数据当中存储了什么，存储了我的这个所有的这个表，所有的库的信息，对不对，那我利用原数据能做什么样的一个工作呢？最典型的一个应用就是呃，这个血缘管理。
07:12
血缘管理，什么叫血缘管理啊，大家想想，我们数仓咱们会分层对吧？哎，好多层，然后每一层都是很多的表啊，都是很多表，比如说呃，我第一层有这么多表，然后我第二层呢，也有这么多表，当咱们这个表与表之间都是有关系的啊，什么关系？比如说我第二层的表，那我的数据来源都是第一层，我们是一层一层的啊，那OK，你这张表是从第一层的哪几张表来的？哎，比如从这来的，哎，那他俩照来的，你是不是就来自于这两张表啊，对不对？那下边一层呢？啊，我可能是这两张表照进来的。对不对，最后一层我可能是哎这几张表上来的对不对，那如果说你能有一个这样的一个图啊，那你再去，呃，去接手这个数层，那就会变得容易多了啊，因为你这个表与表之间的这个血缘关系呢，一目了然啊，我需要什么样的数据，我可以去进行溯源，我从哪张表里去拿，哎，我能够一目了然，哎能够快速的去熟悉来去入手这个数仓。
08:11
啊，是这样的一个作用啊，这样一个作用啊，这是我们做语言数据管理最核心最重要的一个应用，就是做咱们这个血统啊，或者叫做血缘管理啊，什么叫做血缘呀。相当于我这张表是从这两张表来的，对吧，那你相当于这两张表是他的老祖宗对不对，像是有这个血缘关系的啊，是这个意思啊，这个意思啊，那这是语言数据管理当中，我们呃，最重要的一个应用就是学员管理啊，那再往下还有这个质量监控，这个所谓的质量监控指的是什么呢？这个质量指的什么是质量啊。啊，只是咱们数据的质量啊，因为大家都知道啊，咱们数仓啊，我每天需要去重复的计算很多的指标，对吧，那这个指标计算的到底对不对呢？对不对，那有没有丢数据啊，啊或者是有没有什么这个错误，呃，这个计算的这种情况发生呢，对不对，那咱们如果说你要不去呃，人工的一点一点去核对，那你根本就不知道。
09:09
啊，那所以说我们这会儿怎么办呢？诶，可以借助一些这种质量监控的这种框架去帮我们去监控你这个数仓的计算质量是否是OK的，有没有丢数据啊，你的计算结果是否准确啊，可以借助这个质量监控去做啊，这是咱们诶收藏的一些这个东西啊，然后再往下就基本就没有了啊，也是现在目前一个啊相对比较完备的数仓，我应该包含的就是咱们上述的这些东西。啊，那这个数仓里边核心的东西是哪儿呢。啊，其实核心东西是哪儿啊，核心的东西其实可以把咱们下边这个去掉。啊，下边一个去掉这个这几个东西，大家可以想想，它全部都是为了干什么呀。都是为了让咱们这个数仓，呃，首先我我这个监控它的性能，监控性能是不是能够保证咱们数仓的可用性更高一些呀，对不对，运输管理我做那个呃，那个血缘关系呃，能够保保证咱们那个呃去接手一个出仓的时候能够更更加容易呃能够呃管理咱们出仓时候更加方便啊，那质量监控呢，能够保证咱们数仓的这个数据质量啊，那其实他们全都是为了干什么，为了优化咱们数仓，让我们的数仓呢更加好用，对吧？那其实没有这些东西，那数仓能不能跑起来，能跑起来对吧？没有这些东西，我输仓一样跑啊，但是有这些东西呢，输仓会更好啊，就是这个作用啊啊，也就是核心的东西还是我们上边那些啊啊大家接下来往下走，那我们的需求分析相对于说完了，那接下来我们啊，带着这些需求呢，去思考几个问题来。
10:39
第一个问题，项目技术如何选型啊？什么叫做选型呢？比如说我现在要搭建一个用户采集平台，对吧？那我搭建用户采集平台的时候，我应该选用什么样的这个框架呢？啊，对不对，用户行为咱们选啥呀。大家肯定首选就是啥flu对不对，因为咱们只会对吧，有只挥啊，但是其实能够完成这个日志采集的这个功能的框架呢，不止flu挺多的，比如说flu啊，什么log stesh啊等等，什么这个fluent d等等，其实类似的框架有很多啊，那咱们选的时候怎么选对吧？啊，这个需要考虑那第二一个。
11:19
框架版本如何全行，当然这个框架版本呢，咱们这儿呃可以从两个角度去考虑，一个是什么，一个是咱们框架的发行版本，还有一个呢，是咱们框架具体的那个版本号，对吧？这个二点几三点四点几啊是这样啊，那现在我们先看一下咱们这个第一个方向啊，就是这个呃发行那大大家都知道我们这个海杜派啊，咱们这个呃，就是比较大的几个发行版叫什么，比如说呃阿帕奇啊，这是它原生的对吧？那还有一个几，还有几个商业版啊，商业版比如说呃，CDH。啊，还有谁还有HTP这个带大家学海度，刚开始的时候应该介绍过对吧？啊，这个是cloudr公司，这个是hoton works公司，但其实现在这俩公司已经怎么样了。
12:05
已经合并了啊，已经合并了他俩啊，他也合并了啊，呃，然后咱们选的时候呢，我到底应该选谁呢？其实还有一个比较在国外啊，比较知名的一个发行版也是商业版，叫做迈法R啊，迈法啊那公司其实呃，在国内知名度相对来说要低一些啊，所以一般情况下不考虑啊，要考虑的话，你就考虑他们几个，那到底应该选谁呢？对吧，也是需要考虑的啊，那现在往下走。当然还有一个，还有丢了一个角度啊，一个是那个发起嘛，还有一个是那个那个版本号对吧，那比如说我现在选阿帕奇，那你应该选哪个版本的呢？我选2.3的啊，我选3.2的，我应该选谁对吧？需要去考虑啊，还得往下走大边，呃，假如说我这个框架都选完了，对吧？因为我们是从零开始拉出仓，从零开始拉，那服务器咱们应该选什么。对不对啊，咱们现在学习的时候没得选虚拟机对吧，那实际上真实真实搭建的时候你就得考虑了啊，你是物理机还是运主机，那可能有同学会觉得这个问题还需要让我去考虑吗？我是做大数据开发的呀，对不对，我不是运维，为什么要我我去选这个东西呢。
13:10
啊，其实可以这样跟大家说啊，其实现在咱们大数据还远没有发展到那种非常完备的那个程度，不像Java那边，我们家伙已经非常完备的，相当于这个各司其职，对吧，我干什么就是干什么，但是大数据现在呢，其实相对来说还没有那么完备啊，也就是大数据运维人员呢，相对来说还还不是充特别充足，也是咱们到公司之后呢，啊也也会怎么样呢，就相当于顶半个运维吧，就是啥都干啊，干的东西是实际上是比较多的啊，就是虽然呃可能哎咱们公司去了之后呢，不会让我们呃自己去干什么，自己去买服务器回来自己去呃组网去等等，不会让咱们去干这样的一些工作啊，但是他可能会询问你一些意见，对吧？啊，咱公司有传统的运维，但是他也不知道大数据集群到底应该买什么样的服务器，对吧？哎，但所以说老板可能会，哎，让你提供一个方案，诶你说我们大数据这个集群啊，需要买几台服务器呀，那服务器的配置应该是什么样的呀，他可能会咨询你能理解吧？啊就是说咱们大致得知道。
14:10
我们这个大数据服务器应该买什么样的性质，什么样的这个配置的服务器，我们得知道，然后买几台咱们大致得会算才行啊是这样，所以这些东西我们也需要了解啊，要了解对价钱等等，咱们也要了解一下啊，啊那这个大致就是我们，呃，这个这个前面需要考虑几个问题啊，那服务器咱们假如定好了买云主机对吧，那定好了之后呢。你还得考虑一个问题啊，就是买几台服务器啊，就是所谓的如何确定集群规模，就是买多少台服务器，咱们这个需要去计算的啊，不是张口就来了，买十台，那不不是这么来的啊啊，那得需要去计算啊，啊那所以说这些东西现在都是咱们大家需要去思考的问题，那一会儿我们就按照这几个思考题呢，咱们一个一个去解答啊，然后呢，把上面这些需求我们一个一个去，呃正经的分析一下啊好，那我现在把这个呃视频先录一下啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷数仓项目实战V3.0

（3/291）

7分1秒

001-尚硅谷-数据仓库-课程介绍

390

19分57秒

002-尚硅谷-数据仓库-项目概述

350

15分4秒

003-尚硅谷-项目分析-需求分析

300

17分26秒

004-尚硅谷-项目分析-技术选型

420

11分48秒

005-尚硅谷-项目分析-数据流程设计图

370

13分25秒

006-尚硅谷-项目分析-框架版本选择

380

10分2秒

007-尚硅谷-项目分析-服务器选型

270

11分59秒

008-尚硅谷-项目分析-集群规模规划

370

20分1秒

009-尚硅谷-日志采集-埋点目标数据

560

9分50秒

010-尚硅谷-日志采集-主流埋点方式(了解)

460

12分31秒

011-尚硅谷-日志采集-日志数据结构

400

4分42秒

012-尚硅谷-日志采集-埋点数据上报时机

340

14分25秒

013-尚硅谷-日志采集-服务器准备

420

8分40秒

017-尚硅谷-日志采集-JDK配置及免密配置

370

1分48秒

018-尚硅谷-日志采集-JDK分发

370

7分30秒

019-尚硅谷-日志采集-Linux环境变量说明

420

10分24秒

020-尚硅谷-日志采集-模拟生成日志

380

7分37秒

021-尚硅谷-日志采集-模拟日志脚本

380

5分25秒

022-尚硅谷-日志采集-Hadoop部署之环境变量配置

340

19分0秒

023-尚硅谷-日志采集-Hadoop部署之核心配置

520

12分27秒

024-尚硅谷-日志采集-Hadoop部署之其余配置

370

2分43秒

025-尚硅谷-日志采集-Hadoop部署之历史服务器和日志聚集配置

390

4分23秒

026-尚硅谷-日志采集-Hadoop部署之启动及测试

470

9分17秒

027-尚硅谷-日志采集-Hadoop项目经验之多目录存储

360

8分27秒

028-尚硅谷-日志采集-Hadoop项目经验之数据均衡

300

7分30秒

029-尚硅谷-日志采集-Hadoop项目经验之LZO压缩配置

330

5分21秒

030-尚硅谷-日志采集-Hadoop项目经验之LZO压缩测试

380

9分0秒

031-尚硅谷-日志采集-Hadoop项目经验之LZO切片说明

340

8分39秒

032-尚硅谷-日志采集-Hadoop项目经验之参数调优

290

27分28秒

033-尚硅谷-日志采集-Hadoop项目经验之基准测试

360

7分39秒

034-尚硅谷-日志采集-通道设计规划

440

9分38秒

035-尚硅谷-日志采集-Zookeeper部署

270

10分52秒

036-尚硅谷-日志采集-Kafka安装

360

20分5秒

037-尚硅谷-日志采集-Kafka常用脚本

340

5分16秒

038-尚硅谷-日志采集-Kafka常用脚本补充

240

12分51秒

039-尚硅谷-日志采集-Kafka压力测试

330

9分17秒

040-尚硅谷-日志采集-Kafka机器数量与分区数量计算

430

4分31秒

041-尚硅谷-日志采集-Flume安装

400

5分21秒

042-尚硅谷-日志采集-日志采集配置方案对比

340

8分42秒

043-尚硅谷-日志采集-监控日志Flume组件选择

420

23分13秒

044-尚硅谷-日志采集-监控日志Flume配置文件

340

17分57秒

045-尚硅谷-日志采集-监控日志Flume拦截器编码

430

12分7秒

046-尚硅谷-日志采集-监控日志Flume测试

400

28分24秒

047-尚硅谷-日志采集-Flume启停脚本

360

10分31秒

048-尚硅谷-日志采集-消费KafkaFlume功能分析

340

2分18秒

049-尚硅谷-日志采集-消费KafkaFlume中KafkaChannel注意事项

420

37分35秒

050-尚硅谷-日志采集-消费KafkaFlume配置文件

380

9分2秒

051-尚硅谷-日志采集-消费KafkaFlume时间戳拦截器

440

9分26秒

052-尚硅谷-日志采集-消费KafkaFlume测试

390

1分21秒

053-尚硅谷-日志采集-消费KafkaFlume启停脚本

390

4分38秒

054-尚硅谷-日志采集-消费KafkaFlume内存调整

320

3分23秒

055-尚硅谷-日志采集-小结

310

12分12秒

056-尚硅谷-业务数据采集-电商系统概述

370

7分7秒

057-尚硅谷-业务数据采集-电商系统基本概念

340

7分44秒

058-尚硅谷-业务数据采集-电商系统表结构说明

370

25分1秒

059-尚硅谷-业务数据采集-电商系统核心表概述

340

15分55秒

060-尚硅谷-业务数据采集-电商系统表结构讲解

410

7分58秒

061-尚硅谷-业务数据采集-电商系统表字段说明

380

9分27秒

062-尚硅谷-业务数据采集-模拟数据生成之mysql部署

370

3分40秒

063-尚硅谷-业务数据采集-模拟数据生成之建表

350

10分23秒

064-尚硅谷-业务数据采集-模拟数据生成之EZDM使用简明介绍

410

9分39秒

065-尚硅谷-业务数据采集-模拟数据生成之测试

470

7分11秒

066-尚硅谷-业务数据采集-Sqoop概述

400

7分12秒

067-尚硅谷-业务数据采集-Sqoop安装

370

4分53秒

068-尚硅谷-业务数据采集-Sqoop测试

360

26分13秒

069-尚硅谷-业务数据采集-Sqoop基础使用

440

7分4秒

070-尚硅谷-业务数据采集-Sqoop使用之SQL形式导入

350

23分40秒

071-尚硅谷-业务数据采集-数据同步策略

340

14分33秒

072-尚硅谷-业务数据采集-业务数据表同步策略划分

360

40分18秒

073-尚硅谷-业务数据采集-Sqoop导入脚本之基础说明

310

7分33秒

074-尚硅谷-业务数据采集-Sqoop导入脚本之同步策略说明

450

2分40秒

075-尚硅谷-业务数据采集-Sqoop导入脚本之测试

350

1分35秒

076-尚硅谷-业务数据采集-Sqoop导入脚本之存在问题分析

380

3分57秒

077-尚硅谷-业务数据采集-Sqoop导入脚本之数据验证

420

34分16秒

078-尚硅谷-数仓建模理论-分层概述

440

5分48秒

079-尚硅谷-数仓建模理论-数据集市

300

7分43秒

080-尚硅谷-数仓建模理论-命名规范

390

17分1秒

081-尚硅谷-数仓建模理论-范式理论之概述

370

8分27秒

082-尚硅谷-数仓建模理论-范式理论之函数依赖

380

13分9秒

083-尚硅谷-数仓建模理论-范式理论之三范式

420

12分35秒

084-尚硅谷-数仓建模理论-OLTP与OLAP概述

420

18分6秒

085-尚硅谷-数仓建模理论-关系建模与维度建模

520

15分2秒

086-尚硅谷-数仓建模理论-维度模型之事实表与维度表

500

17分0秒

087-尚硅谷-数仓建模理论-维度模型之事实表分类

380

9分27秒

088-尚硅谷-数仓建模理论-维度模型之模型分类

490

13分41秒

089-尚硅谷-数仓建模理论-数仓分层模型之整体概述

380

4分33秒

090-尚硅谷-数仓建模理论-数仓分层模型之ODS层

380

26分1秒

091-尚硅谷-数仓建模理论-数仓分层模型之DWD层

310

30分51秒

092-尚硅谷-数仓建模理论-数仓分层模型之DWD层维度建模演示

400

11分2秒

093-尚硅谷-数仓建模理论-数仓分层模型之DWS层与DWT层

370

2分10秒

094-尚硅谷-数仓建模理论-数仓分层模型之建模驱动

430

10分34秒

095-尚硅谷-数仓环境准备-Hive安装

400

4分30秒

096-尚硅谷-数仓环境准备-Hive引擎说明

410

8分35秒

097-尚硅谷-数仓环境准备-框架兼容性问题说明

330

23分32秒

098-尚硅谷-数仓环境准备-HiveOnSpark配置

590

10分7秒

099-尚硅谷-数仓环境准备-HiveOnSpark测试

480

17分14秒

100-尚硅谷-数仓环境准备-Yarn容量调度器之并发度问题演示

400

19分38秒

101-尚硅谷-数仓环境准备-Yarn容量调度器之多队列配置

350

8分21秒

102-尚硅谷-数仓环境准备-Yarn容量调度器之提交任务指定队列

380

100

8分24秒

103-尚硅谷-数仓环境准备-DataGrip使用介绍

380

101

16分43秒

104-尚硅谷-数仓环境准备-新数据准备

350

102

11分4秒

105-尚硅谷-数仓搭建-ODS层日志表之建表语句

380

103

5分32秒

106-尚硅谷-数仓搭建-ODS层日志表之数据装载

360

104

7分58秒

107-尚硅谷-数仓搭建-ODS层日志表之装载脚本

330

105

4分33秒

108-尚硅谷-数仓搭建-扩展之Shell脚本引号总结

370

106

6分18秒

109-尚硅谷-数仓搭建-ODS层业务表之建表语句

340

107

4分28秒

110-尚硅谷-数仓搭建-ODS层业务表之装载脚本

420

108

8分8秒

111-尚硅谷-数仓搭建-DWD层日志表之数据结构回顾

400

109

7分34秒

112-尚硅谷-数仓搭建-DWD层日志表之Hive解析JSON函数说明

450

110

6分3秒

113-尚硅谷-数仓搭建-DWD层日志表之日志解析思路分析

340

111

7分26秒

114-尚硅谷-数仓搭建-DWD层日志表之启动表建表语句

330

112

9分0秒

115-尚硅谷-数仓搭建-DWD层日志表之启动表数据装载

360

113

4分28秒

116-尚硅谷-数仓搭建-DWD层日志表之页面表

380

114

9分14秒

117-尚硅谷-数仓搭建-DWD层日志表之动作表解析思路

360

115

5分42秒

118-尚硅谷-数仓搭建-回顾之explode函数使用说明

340

116

3分16秒

119-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数设计

270

117

11分16秒

120-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数说明

420

118

27分6秒

121-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(一)

380

119

8分49秒

122-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数编写(二)

390

120

3分38秒

123-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数注意事项

300

121

6分10秒

124-尚硅谷-数仓搭建-DWD层日志表之动作表UDTF函数创建

360

122

8分6秒

125-尚硅谷-数仓搭建-DWD层日志表之动作表数据装载

420

123

4分47秒

126-尚硅谷-数仓搭建-DWD层日志表之曝光表

450

124

9分8秒

127-尚硅谷-数仓搭建-DWD层日志表之错误表

400

125

9分57秒

128-尚硅谷-数仓搭建-DWD层数据装载之lzo索引文件识别问题

340

126

5分46秒

129-尚硅谷-数仓搭建-DWD层日志表之数据装载脚本

370

127

4分54秒

130-尚硅谷-数仓搭建-DWD层业务表之维度模型概述

340

128

11分5秒

131-尚硅谷-数仓搭建-DWD层业务表之商品维度表

330

129

1分50秒

132-尚硅谷-数仓搭建-DWD层业务表之优惠券维度表

430

130

11分44秒

133-尚硅谷-数仓搭建-DWD层业务表之活动维度表

350

131

3分40秒

134-尚硅谷-数仓搭建-DWD层业务表之地区维度表

450

132

16分34秒

135-尚硅谷-数仓搭建-DWD层业务表之时间维度表

340

133

19分22秒

136-尚硅谷-数仓搭建-DWD层业务表之支付事实表

380

134

7分22秒

137-尚硅谷-数仓搭建-DWD层业务表之退款事实表

300

135

9分45秒

138-尚硅谷-数仓搭建-DWD层业务表之评价事实表

390

136

7分8秒

139-尚硅谷-数仓搭建-DWD层业务表之订单明细实表建表语句

380

137

14分1秒

140-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(一)

310

138

9分26秒

141-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(二)

300

139

10分46秒

142-尚硅谷-数仓搭建-DWD层业务表之订单明细事实表数据装载(三)

290

140

7分56秒

143-尚硅谷-数仓搭建-DWD层业务表之加购与收藏事实表

390

141

10分16秒

144-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分析

390

142

7分48秒

145-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表分区规划

380

143

9分35秒

146-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载思路

320

144

16分4秒

147-尚硅谷-数仓搭建-DWD层业务表之优惠券领用事实表数据装载

330

145

9分53秒

148-尚硅谷-数仓搭建-DWD层业务表之订单事实表建表语句

430

146

43分22秒

149-尚硅谷-数仓搭建-DWD层业务表之订单事实表数据装载

340

147

17分10秒

150-尚硅谷-数仓搭建-DWD层业务表之拉链表概述

330

148

15分19秒

151-尚硅谷-数仓搭建-DWD层业务表之拉链表制作过程概述

350

149

17分40秒

152-尚硅谷-数仓搭建-DWD层业务表之用户维度表(一)

400

150

19分44秒

153-尚硅谷-数仓搭建-DWD层业务表之用户维度表(二)

390

151

8分10秒

154-尚硅谷-数仓搭建-DWD层业务表之数据装载脚本

340

152

28分38秒

155-尚硅谷-数仓搭建-DWS&DWT层之业务术语

360

153

14分11秒

156-尚硅谷-数仓搭建-DWS&DWT层之日期函数

380

154

7分22秒

157-尚硅谷-数仓搭建-DWS&DWT层之复杂数据类型使用说明

330

155

16分3秒

158-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表建表语句

400

156

47分40秒

159-尚硅谷-数仓搭建-DWS层之会员主题每日汇总表数据装载

270

157

24分16秒

160-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表建表语句

310

158

6分37秒

161-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载思路分析

390

159

14分46秒

162-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(一)

390

160

29分43秒

163-尚硅谷-数仓搭建-DWT层之会员主题累积汇总表数据装载(二)

360

161

5分43秒

164-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表建表语句

330

162

13分7秒

165-尚硅谷-数仓搭建-DWS层之设备主题每日汇总表数据装载

370

163

6分35秒

166-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表建表语句

340

164

13分45秒

167-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表初次装载说明

390

165

9分28秒

168-尚硅谷-数仓搭建-DWT层之设备主题累积汇总表数据装载

480

166

1分20秒

169-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表建表语句

370

167

23分6秒

170-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(一)

390

168

24分27秒

171-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

430

169

9分25秒

172-尚硅谷-数仓搭建-DWS层之商品主题每日汇总表数据装载(二)

320

170

12分3秒

173-尚硅谷-数仓搭建-DWT层之商品主题累积汇总表

400

171

20分48秒

174-尚硅谷-数仓搭建-DWS&DWT层之活动主题汇总表

430

172

16分29秒

175-尚硅谷-数仓搭建-DWS&DWT层之地区主题汇总表

430

173

7分5秒

176-尚硅谷-数仓搭建-DWS&DWT层之数据装载脚本

401

174

45分43秒

177-尚硅谷-数仓需求-设备主题之活跃设备数

350

175

4分36秒

178-尚硅谷-数仓需求-设备主题之新增&沉默&流失需求说明

330

176

6分13秒

179-尚硅谷-数仓需求-设备主题之新增设备数需求讲解

260

177

4分9秒

180-尚硅谷-数仓需求-设备主题之沉默用户数需求讲解

380

178

2分51秒

181-尚硅谷-数仓需求-设备主题之流失用户数需求讲解

370

179

8分5秒

182-尚硅谷-数仓需求-设备主题之留存率需求说明

430

180

2分2秒

183-尚硅谷-数仓需求-设备主题之回流用户数需求说明(一)

430

181

2分9秒

184-尚硅谷-数仓需求-设备主题之回流用户数需求说明(二)

400

182

1分57秒

185-尚硅谷-数仓需求-设备主题之最近三周连续活跃用户数需求说明

390

183

2分15秒

186-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求说明

360

184

16分33秒

187-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路一)

420

185

8分26秒

188-尚硅谷-数仓需求-设备主题之连续三周活跃需求讲解(思路二)

330

186

14分24秒

189-尚硅谷-数仓需求-设备主题之回流用户数需求讲解

370

187

21分0秒

190-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路一)

410

188

9分28秒

191-尚硅谷-数仓需求-设备主题之留存率需求讲解(思路二)

410

189

20分19秒

192-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路一)

350

190

13分4秒

193-尚硅谷-数仓需求-设备主题之七天内连续三天活跃需求讲解(思路二)

330

191

4分44秒

194-尚硅谷-数仓需求-会员主题之会员信息统计需求说明

370

192

5分15秒

195-尚硅谷-数仓需求-会员主题之漏斗分析需求说明

390

193

1分51秒

196-尚硅谷-数仓需求-商品主题之商品个数需求说明

340

194

10分1秒

197-尚硅谷-数仓需求-会员主题之会员信息统计需求讲解

330

195

21分8秒

198-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路一)

370

196

6分16秒

199-尚硅谷-数仓需求-会员主题之漏斗分析需求讲解(思路二)

270

197

5分51秒

200-尚硅谷-数仓需求-商品主题之商品个数需求讲解

310

198

8分5秒

201-尚硅谷-数仓需求-商品主题之全局TopN需求说明

380

199

2分45秒

202-尚硅谷-数仓需求-商品主题之分组TopN需求说明

390

200

4分28秒

203-尚硅谷-数仓需求-商品主题之销量排行需求讲解

330

201

3分21秒

204-尚硅谷-数仓需求-商品主题之退款率排行需求讲解

390

202

2分44秒

205-尚硅谷-数仓需求-商品主题之差评率排行需求讲解

360

203

10分57秒

206-尚硅谷-数仓需求-商品主题之分组TopN需求讲解

330

204

7分32秒

207-尚硅谷-数仓需求-营销主题之下单&支付统计需求说明

350

205

9分14秒

208-尚硅谷-数仓需求-营销主题之品怕复购率需求说明

380

206

3分44秒

209-尚硅谷-数仓需求-营销主题之下单统计需求讲解

370

207

11分45秒

210-尚硅谷-数仓需求-营销主题之支付统计需求讲解

350

208

16分54秒

211-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路一)

370

209

9分18秒

212-尚硅谷-数仓需求-营销主题之复购率需求讲解(思路二)

460

210

7分48秒

213-尚硅谷-数仓需求-ADS层数据导入脚本

400

211

14分47秒

214-尚硅谷-全流程调度-工作流程概述

360

212

11分26秒

215-尚硅谷-全流程调度-调度系统概述

400

213

7分54秒

216-尚硅谷-全流程调度-Azkaban部署模式概述

380

214

2分57秒

217-尚硅谷-全流程调度-Azkaban安装之安装包准备

380

215

5分53秒

218-尚硅谷-全流程调度-Azkaban安装之数据库准备

340

216

11分25秒

219-尚硅谷-全流程调度-Azkaban安装之Exec部署

400

217

10分6秒

220-尚硅谷-全流程调度-Azkaban安装之Web部署

470

218

7分53秒

221-尚硅谷-全流程调度-Azkaban使用之入门案例

350

219

5分30秒

222-尚硅谷-全流程调度-Azkaban使用之工作流程配置文件说明

390

220

11分22秒

223-尚硅谷-全流程调度-Azkaban使用之Yaml文件格式概述

390

221

6分34秒

224-尚硅谷-全流程调度-Azkaban使用之任务依赖配置

420

222

4分23秒

225-尚硅谷-全流程调度-Azkaban使用之自动失败重试

380

223

3分56秒

226-尚硅谷-全流程调度-Azkaban使用之手动失败重试

390

224

6分57秒

227-尚硅谷-全流程调度-Azkaban使用之定时调度

410

225

9分35秒

228-尚硅谷-全流程调度-Azkaban使用之邮件配置

470

226

4分35秒

229-尚硅谷-全流程调度-Azkaban使用之邮件通知演示

310

227

5分14秒

230-尚硅谷-全流程调度-实操之Sqoop导出功能说明

440

228

15分3秒

231-尚硅谷-全流程调度-实操之MySQL建库建表

330

229

28分36秒

232-尚硅谷-全流程调度-实操之Sqoop导出脚本

380

230

6分58秒

233-尚硅谷-全流程调度-实操之新数据准备

360

231

7分13秒

234-尚硅谷-全流程调度-实操之Azkaban启停脚本

370

232

11分9秒

235-尚硅谷-全流程调度-实操之Azkaban工作流程配置文件编写

360

233

5分22秒

236-尚硅谷-全流程调度-实操之Azkaban工作流传参说明

440

234

9分34秒

237-尚硅谷-全流程调度-实操之Azkaban全流程调度演示

360

235

8分16秒

238-尚硅谷-全流程调度-实操之Azkaban问题总结

360

236

4分45秒

239-尚硅谷-数据可视化-概述

450

237

6分22秒

240-尚硅谷-数据可视化-Superset概述

370

238

15分56秒

241-尚硅谷-数据可视化-Superset安装之Miniconda部署

520

239

9分43秒

242-尚硅谷-数据可视化-Superset安装之准备Python3.6环境

430

240

7分2秒

243-尚硅谷-数据可视化-Superset安装

530

241

5分31秒

244-尚硅谷-数据可视化-Superset安装之初始化

490

242

6分20秒

245-尚硅谷-数据可视化-Superset安装之启动

400

243

9分52秒

246-尚硅谷-数据可视化-Superset安装之启停脚本

380

244

12分40秒

247-尚硅谷-数据可视化-Superset使用之对接数据源

450

245

13分39秒

248-尚硅谷-数据可视化-Superset使用之趋势图示例

780

246

7分29秒

249-尚硅谷-数据可视化-Superset使用之地图与饼状图示例

980

247

5分17秒

250-尚硅谷-数据可视化-Superset使用之编辑仪表盘

540

248

4分46秒

251-尚硅谷-即席查询-概述

370

249

4分42秒

252-尚硅谷-即席查询-Kylin概述

370

250

38分9秒

253-尚硅谷-即席查询-Kylin前置概念

310

251

12分46秒

254-尚硅谷-即席查询-Kylin基础架构

320

252

6分35秒

255-尚硅谷-即席查询-Kylin特点

310

253

14分12秒

256-尚硅谷-即席查询-Kylin安装之HBase部署

340

254

2分30秒

257-尚硅谷-即席查询-Kylin安装之环境变量准备

380

255

13分19秒

258-尚硅谷-即席查询-Kylin安装之兼容性问题说明

380

256

4分15秒

259-尚硅谷-即席查询-Kylin启动

440

257

30分54秒

260-尚硅谷-即席查询-Kylin使用之基础用法

360

258

21分49秒

261-尚硅谷-即席查询-Kylin使用之维度表重复key问题说明

380

259

8分29秒

262-尚硅谷-即席查询-Kylin使用之查询

390

260

12分39秒

263-尚硅谷-即席查询-Kylin使用之RestAPI使用概述

260

261

9分21秒

264-尚硅谷-即席查询-Kylin使用之每日定时构建脚本

440

262

6分42秒

265-尚硅谷-即席查询-Kylin原理之基础概念回顾

330

263

8分21秒

266-尚硅谷-即席查询-Kylin原理之Cube存储原理

480

264

15分2秒

267-尚硅谷-即席查询-Kylin原理之Cube构建原理

320

265

18分0秒

268-尚硅谷-即席查询-Kylin优化之衍生维度

400

266

13分24秒

269-尚硅谷-即席查询-Kylin优化之聚合组

340

267

15分23秒

270-尚硅谷-即席查询-Kylin优化之Rowkey调整

330

268

8分51秒

271-尚硅谷-即席查询-Kylin优化之并发粒度优化

370

269

7分13秒

272-尚硅谷-即席查询-KylinBI集成之JDBC

390

270

11分47秒

273-尚硅谷-即席查询-KylinBI集成之Zeppelin

390

271

25分6秒

274-尚硅谷-即席查询-Presto概述

340

272

23分45秒

275-尚硅谷-即席查询-Presto安装之Server部署

370

273

5分56秒

276-尚硅谷-即席查询-Presto安装之命令行客户端部署

340

274

8分54秒

277-尚硅谷-即席查询-Presto安装之LZO 压缩格式说明

320

275

8分14秒

278-尚硅谷-即席查询-Presto安装之可视化客户端部署

440

276

17分31秒

279-尚硅谷-即席查询-Presto使用注意事项

390

277

13分49秒

280-尚硅谷-集群监控-Zabbix概述

460

278

7分45秒

281-尚硅谷-集群监控-Zabbix安装之服务器环境准备

310

279

12分29秒

282-尚硅谷-集群监控-Zabbix安装之yum仓库配置

350

280

2分8秒

283-尚硅谷-集群监控-Zabbix安装之下载安装

380

281

10分9秒

284-尚硅谷-集群监控-Zabbix安装之修改配置文件

310

282

2分21秒

285-尚硅谷-集群监控-Zabbix启动

330

283

3分37秒

286-尚硅谷-集群监控-Zabbix安装之web配置

320

284

5分3秒

287-尚硅谷-集群监控-Zabbix使用之术语

400

285

7分17秒

288-尚硅谷-集群监控-Zabbix使用之创建主机

360

286

13分43秒

289-尚硅谷-集群监控-Zabbix使用之配置监控项

330

287

6分13秒

290-尚硅谷-集群监控-Zabbix使用之配置触发器

350

288

3分18秒

291-尚硅谷-集群监控-Zabbix使用之配置报警媒介

380

289

7分56秒

292-尚硅谷-集群监控-Zabbix使用之配置动作

320

290

2分12秒

293-尚硅谷-集群监控-Zabbix使用之测试

430

291

12分59秒

294-尚硅谷-集群监控-Zabbix使用之模板

390

003-尚硅谷-项目分析-需求分析

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐