文章/答案/技术大牛

发布

首页视频094_尚硅谷_实时电商项目_内容回顾

094_尚硅谷_实时电商项目_内容回顾

2022-12-022022-12-02 16:02:24播放38

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据电商项目(实时处理)/视频/094_尚硅谷_实时电商项目_内容回顾.avi

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
呃，回顾一下，呃，那么其实呢，昨天咱们主要呢，讲的是我们这个首单分析对吧，它的一个数据采集这一块啊，那么首单分析呢，首先大家知道对吧，那么咱们现在呢，要做首单分析是吧？那么首单分析的话呢，这个数据应该来源于哪呢？应该来源于我们这个业务啊订单的业务数据，那么这个业务数据呢，在我买SQL里边，那我这个MY搜Q数据库的数据啊，那我现在想实时的获取，那怎么来获取呢？短，那咱们使用我的can或者是Maxwell对吧？那这两种方式呢，对吧，大家呢都要尝试一下，对，有些东西现在是kind完事了，那Maxwell呢还没试对吧？那咱们后边呢一直用我们的Maxwell，就大家呢把这两种方式都要试一下是吧？然后接下来那我们通过我们这个kind或者Maxwell它的一个配置啊，然后呢，将我们这个业务数据啊，采集到我们卡不卡它对应的主题里边来，对吧？但是这个时候呀，有一个问题什么呢？就是我所有的数据的变化是不是都是采集到咱们。
01:00
当前我们现在是吧，这一个主题里边来了呀，所有表变化的数据啊，都在咱们这一个主题是吧？都这一个主题，所以说呢，那咱们需要对我们这个数据啊做一个分流啊，那么咱们是怎么做的呢？我们写了一个我们这个Spark stream程序对吧？写的Spark程序，那么这个Spark stream程序呢，它主要负责的事，从我们的卡夫卡呀，先把这个数据给拿出来啊，就读取我们现在对吧，这个两个主题数据对吧？那么这块呢，大家注意啊，那现在因为我们两种方式了，那一个是读取我们这Kindle对吧，它采集到主体数据，那么另外一个呢，对吧，那么咱们呢，如果说我要是马采集的话，那么他也要读取我们这个啊这个主题数据，然后将下来，接下来呢，那么咱们把数据给拿到之后呢，我们根据我们当前采集到的一个，呃，这个Jason啊才叫Jason，那里面有个属性啊叫什么啊table，然后呢，咱们根据我们的表名，然后接下来将我们现在的这个数据啊发送到不同的。
02:00
的主题里去，那么具体咱们这个代码呢，大家可以看一看，昨天呢，咱们在这里对吧，来到我们这个啊ods层到ods层，那么我现在呢，在ods层我们两个实现的，一个呢，是通过我们这个Kindle的去做一个采集啊，一个通过Kindle来做采集，那么如果通过kind做采集的话，那么前面这一套东西呢，那都是固定的对吧？先获取我们这个偏移量，然后根据偏移量呢，到卡普卡来拿数据，对吧？然后接下来那么咱们把我们当前批次它消费的我们的偏量都给记录下来，然后接下来呢，在咱们这里边，我对我的数据呢，做一个格式转换，原来是字串，现在呢给转换成基因对象，这个基对象呢，方便我们来进行操作，对吧？然后接下来那么咱们呢，要这个什么呀，要我们分流，那么这个分流呢，那应该这样对吧，我们现在呢，使用我们这个行动算子for r DD，然后接下来在Ford里边呢，对我数据来做。
03:00
一个便历，每次遍历啊得到的是一个G对象，然后接下来那我们判断一下当前呢，它是不是我们现在对吧，这个insert对吧？当前我操作是不是insert操作，那么如果说啊，咱们现在是我们这个insert操作的话，那么这个时候呢，我要去把咱们什么表名啊，对什么数据啊，像这些东西给它获取到啊把这个表名，然后咱数据呢给它获取到对吧？然后接下来那么咱们现在呢，那么获取到之后呢，这里啊，我拼接一个新的to米名字，就我现在要给你表明，然后把这个表当前的采集到数据对吧？给它发送到我这主题里面来对吧？那么这个时候呢，本身我拿到的是一个对的数组对吧，其实是一个JS格式数组，然后咱们现在呢，对我的数组啊，做一个转换转成该了，然后接下来那么咱们通过我们封装的一个工具类，然后把当前我们的一个数据啊，把当前数据给发送到我们的卡夫卡对应的主题里边去啊，给发送到我们的卡法对主。
04:00
推出去大概呢，是一个这样的一个操作啊，然后最后那操作完之后呢，咱们把偏移量啊给提交一下啊，我提提交一下，其实整个呢，咱们现在这块呢，大家注意整个我现在蓝色区域啊，它其实都是什么，都是我们现在这个卡夫卡的内容，对吧？那么只不过呢，我们在卡夫卡里边要进行一个我们的分层啊，在卡卡里面进行分层，这个其实就和你们在have里边进行分层是一样的，对吧？有的说我have分五层，你这里是不是也一样的对吧？那不一定，同学们不是说咱们学了五层，你到时候在咱们这公司里边一定是五层，对吧，那得根据什么呀，对吧，如果说你要是自己去设计的话，同学们这个可能是五层，对吧，因为你就这么这个这个习惯的嘛，对吧，或者说我现在做实实你可能和我的分层方式一样，对吧，等你到公司的话，那每个公司可能有不同的一个项目经理对吧，你看项目经理他是怎么做的，怎么设计的，对吧？哎，所以说这块呢，要有个分层思想对吧，那么这块其实算不算分层呢？这块其实严格不算这个什么，这个其实是不就是我的采集数据啊，对吧。
05:00
这这块就是一个采集数据，然后接下来，那么采集数据分完这块分流呢，那其实呢，它属于什么？属于我们这个ods，呃这块呢，其属于我们这个ods层对吧？那么这个ods层它是怎么做的？就是根据我们这个SPA推并程序对分流之后对吧，然后接下来对吧，然后呢，啊把这个写回写回到我的卡卡之后，对形成了一个ods层，对形成一个这样的一个数据，呃这块呢，是咱们昨天内容啊，那么对于我们昨天的内容，包括咱们前面到目前为止大家呢，就写的代码对吧？那么哪些代码呢，大家必须得知道对吧，首先对吧，就假如说啊同学们让你们自己去对吧去写的话，对吧，最起码呢，怎么样去连接啊，卡不卡这个你得知道。对吧，反正这个东西如果说你要去复制粘贴的话，也没太大问题，对吧？但大概的思路你是不是知道对吧？那些参数呢，你可以复制粘贴，比如说因为现在要卡链接，卡不卡的话，需要提供一些参数，这个参数有哪些啊，你可以复制粘贴，但是最起码你得知道我如果要是往卡卡的生产数据对吧？那么这个它底层呢，其实是new的一个卡卡producer对吧？如果说我现在要从卡卡里这个消费数据的话，那么这个时候注意，如果你要是没有Spark的话，那这个时候呢，应该是consumer对吧？啊，卡卡consumer，但如果有咱们那个SPA SPA swimming的话，这个时候咱们是不是应该是通过我们这个卡卡U对吧，来获取一个离散化流啊对吧？哎，那么这会呢，也要注意一下，然后另外一个呢，那么重点重点重点对吧，就是这块啊，这个东西是不是关于我们这个精准的消费啊，那么以后呢，再有机会我再去这个检查大家作业的时候呢，可能就是让某些人说一下了，对吧，比如说我们现在做了这么多这个这么多次啊，这么多遍进入一次消费，对吧？那。
06:48
你这个东西呢，你得给我描述明白对吧？比如说我现在一说到基准一次性对，让你给我描述对吧，你应该把这一套给我描述出来，那么你们是怎么样保证精一次消费的对吧？那这块呢，大概的实现过程你要应该给我说明白，而且大家在描述的时候啊，注意啊，一定要有个度对吧，不要说什么，就来我现在描述一下精理的消费，你到这里把这代码给我背出来对吧，这块不要对吧，给我说一个度对吧，你们到时候可以准备，后边会问啊，后边会问对吧，把这个呢说停。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据电商项目(实时处理)

（94/174）

2分19秒

001_尚硅谷_实时电商项目_项目介绍

370

11分53秒

002_尚硅谷_实时电商项目_离线架构回顾

350

11分46秒

003_尚硅谷_实时电商项目_实时架构讲解

370

8分45秒

004_尚硅谷_实时电商项目_项目需求介绍

380

10分32秒

005_尚硅谷_实时电商项目_模拟生成数据

400

7分3秒

006_尚硅谷_实时电商项目_SpringBoot介绍

360

20分2秒

007_尚硅谷_实时电商项目_SpringBoot程序创建

360

25分2秒

008_尚硅谷_实时电商项目_创建LoggerController接收模拟器生成数据

390

17分6秒

009_尚硅谷_实时电商项目_利用logback将日志数据落盘

340

25分23秒

010_尚硅谷_实时电商项目_将日志发送到kafka对应的主题中

360

12分36秒

011_尚硅谷_实时电商项目_内容回顾

330

20分20秒

012_尚硅谷_实时电商项目_打包日志处理程序到单台Linux上运行

390

11分23秒

013_尚硅谷_实时电商项目_负载均衡介绍

320

22分58秒

014_尚硅谷_实时电商项目_Nginx安装和启动

330

12分58秒

015_尚硅谷_实时电商项目_Nginx配置文件说明

330

14分0秒

016_尚硅谷_实时电商项目_Nginx常用应用场景

320

17分53秒

017_尚硅谷_实时电商项目_整体流程测试

420

7分32秒

018_尚硅谷_实时电商项目_编写脚本启动Nginx以及日志服务

330

15分13秒

019_尚硅谷_实时电商项目_日活业务介绍

360

16分1秒

020_尚硅谷_实时电商项目_上午内容回顾

430

21分35秒

021_尚硅谷_实时电商项目_ElasticSearch介绍

490

9分10秒

022_尚硅谷_实时电商项目_RestFul编程风格

410

18分56秒

023_尚硅谷_实时电商项目_特点

350

9分36秒

024_尚硅谷_实时电商项目_Lucene、Nutch、ElasticSearch关系

440

25分48秒

025_尚硅谷_实时电商项目_ElasticSearch安装以及单节点启动测试

330

30分59秒

026_尚硅谷_实时电商项目_Kibana安装以及测试

340

13分43秒

027_尚硅谷_实时电商项目_内容回顾

320

33分2秒

028_尚硅谷_实时电商项目_相关概念介绍

420

18分56秒

029_尚硅谷_实时电商项目_对索引的操作

430

27分7秒

030_尚硅谷_实时电商项目_对文档的操作1

360

19分36秒

031_尚硅谷_实时电商项目_对文档的操作2

340

17分34秒

032_尚硅谷_实时电商项目_按分词查询

280

25分29秒

033_尚硅谷_实时电商项目_查询操作1

370

10分46秒

034_尚硅谷_实时电商项目_查询操作2

350

13分30秒

035_尚硅谷_实时电商项目_聚合操作

330

15分0秒

036_尚硅谷_实时电商项目_ik分词器

400

7分34秒

037_尚硅谷_实时电商项目_自定义词库（本地）

370

17分7秒

038_尚硅谷_实时电商项目_自定义词库（远程）

370

27分3秒

039_尚硅谷_实时电商项目_mapping

380

24分20秒

040_尚硅谷_实时电商项目_内容回顾

370

18分55秒

041_尚硅谷_实时电商项目_别名

310

19分58秒

042_尚硅谷_实时电商项目_索引模板

360

30分8秒

043_尚硅谷_实时电商项目_JestFactory对象的创建

330

15分35秒

044_尚硅谷_实时电商项目_向ES中插入单条数据方式1

390

19分6秒

045_尚硅谷_实时电商项目_向ES中插入单条数据方式2

320

6分39秒

046_尚硅谷_实时电商项目_根据id查询索引中的单条文档

320

19分57秒

047_尚硅谷_实时电商项目_根据查询条件查询多条文档1

420

23分56秒

048_尚硅谷_实时电商项目_根据查询条件查询多条文档2

420

6分45秒

049_尚硅谷_实时电商项目_日活业务介绍

320

13分25秒

050_尚硅谷_实时电商项目_搭建日活开发环境

280

9分50秒

051_尚硅谷_实时电商项目_读取配置文件的工具类

380

17分59秒

052_尚硅谷_实时电商项目_读取Kafka数据的工具类

260

16分30秒

053_尚硅谷_实时电商项目_获取Redis客户端工具类

320

28分10秒

054_尚硅谷_实时电商项目_编写SparkStreaming程序消费kafka数据

380

11分44秒

055_尚硅谷_实时电商项目_内容回顾

390

16分28秒

056_尚硅谷_实时电商项目_已经登录设备去重思路分析

430

15分10秒

057_尚硅谷_实时电商项目_通过Redis对已经登录的数据进行去重方式1

420

18分24秒

058_尚硅谷_实时电商项目_通过Redis对已经登录的数据进行去重方式2

380

29分52秒

059_尚硅谷_实时电商项目_将采集到的数据批量保存到ES中业务实现

310

15分46秒

060_尚硅谷_实时电商项目_批量保存ES代码的实现

370

9分51秒

061_尚硅谷_实时电商项目_去重和保存到ES总结

310

20分29秒

062_尚硅谷_实时电商项目_kafka内容回顾1

430

12分17秒

063_尚硅谷_实时电商项目_kafka内容回顾2

320

27分34秒

064_尚硅谷_实时电商项目_kafka内容回顾3

330

14分17秒

065_尚硅谷_实时电商项目_kafka内容回顾4

330

21分5秒

066_尚硅谷_实时电商项目_精准一次性消费方案分析

350

8分30秒

067_尚硅谷_实时电商项目_手动提交偏移量+幂等性处理分析

380

20分13秒

068_尚硅谷_实时电商项目_从Redis中获取偏移量

360

18分25秒

069_尚硅谷_实时电商项目_内容回顾

310

24分53秒

070_尚硅谷_实时电商项目_从指定偏移量读取Kafka数据并获取偏移量位置

330

20分22秒

071_尚硅谷_实时电商项目_保存偏移量到Redis

350

12分33秒

072_尚硅谷_实时电商项目_关于去重

340

25分31秒

073_尚硅谷_实时电商项目_通过kibana进行可视化展示

520

14分34秒

074_尚硅谷_实时电商项目_发布查询接口架构介绍

430

18分26秒

075_尚硅谷_实时电商项目_搭建项目架构

400

23分36秒

076_尚硅谷_实时电商项目_获取当前日活数的Service方法实现

340

14分23秒

077_尚硅谷_实时电商项目_获取日活Controller处理

330

19分58秒

078_尚硅谷_实时电商项目_获取分时日活数Service方法实现

370

15分12秒

079_尚硅谷_实时电商项目_获取分时日活数Controller处理

360

11分28秒

080_尚硅谷_实时电商项目_前端访问数据接口测试

380

3分22秒

081_尚硅谷_实时电商项目_内容回顾

340

25分11秒

082_尚硅谷_实时电商项目_首单业务分析

380

14分35秒

083_尚硅谷_实时电商项目_canal使用场景

360

6分40秒

084_尚硅谷_实时电商项目_canal工作原理

420

24分37秒

085_尚硅谷_实时电商项目_MySQL前期准备工作

350

24分26秒

086_尚硅谷_实时电商项目_canal配置以及单机测试

340

10分6秒

087_尚硅谷_实时电商项目_canal高可用

390

11分19秒

088_尚硅谷_实时电商项目_上午内容回顾

430

32分22秒

089_尚硅谷_实时电商项目_使用canal进行分流处理

380

14分35秒

090_尚硅谷_实时电商项目_封装向Kafka发送数据工具类并对canal分流进行测试

290

26分5秒

091_尚硅谷_实时电商项目_maxwell的安装以及配置

390

27分58秒

092_尚硅谷_实时电商项目_编写BaseDBMaxwellApp对数据进行分流

330

3分12秒

093_尚硅谷_实时电商项目_总结

420

7分18秒

094_尚硅谷_实时电商项目_内容回顾

380

35分26秒

095_尚硅谷_实时电商项目_Hbase回顾1

360

33分54秒

096_尚硅谷_实时电商项目_Hbase回顾2

380

6分54秒

097_尚硅谷_实时电商项目_Phoenix客户端连接工具

400

26分40秒

098_尚硅谷_实时电商项目_封装Phoenix查询工具类

390

12分36秒

099_尚硅谷_实时电商项目_客户端工具问题解决

340

100

23分23秒

100_尚硅谷_实时电商项目_从kafka订单主题中读取数据

340

101

12分3秒

101_尚硅谷_实时电商项目_判断是否首单方案1

320

102

18分17秒

102_尚硅谷_实时电商项目_判断是否首单方案2

440

103

20分32秒

103_尚硅谷_实时电商项目_更新Phoenix中用户消费状态

300

104

6分14秒

104_尚硅谷_实时电商项目_Phoenix客户端连接工具2

310

105

18分42秒

105_尚硅谷_实时电商项目_尚硅谷大数据_实时项目_同批次状态修正

400

106

6分58秒

106_尚硅谷_实时电商项目_总结

350

107

16分29秒

107_尚硅谷_实时电商项目_内容回顾

430

108

27分7秒

108_尚硅谷_实时电商项目_维度表关联分析

370

109

19分48秒

109_尚硅谷_实时电商项目_省份维度表的处理1

410

110

24分40秒

110_尚硅谷_实时电商项目_省份维度表的处理2

330

111

25分40秒

111_尚硅谷_实时电商项目_用户维度表的处理1

420

112

18分2秒

112_尚硅谷_实时电商项目_用户维度表的处理2

290

113

9分52秒

113_尚硅谷_实时电商项目_上午内容回顾

320

114

5分27秒

114_尚硅谷_实时电商项目_和省份维度关联思路

290

115

22分35秒

115_尚硅谷_实时电商项目_和省份维度关联方案1

300

116

18分37秒

116_尚硅谷_实时电商项目_和省份维度关联方案2

350

117

13分0秒

117_尚硅谷_实时电商项目_和用户维度关联

360

118

19分23秒

118_尚硅谷_实时电商项目_保存订单数据到ES中

380

119

11分37秒

119_尚硅谷_实时电商项目_使用Kibana进行可视化

330

120

2分55秒

120_尚硅谷_实时电商项目_总结

350

121

11分2秒

121_尚硅谷_实时电商项目_内容回顾

350

122

13分16秒

122_尚硅谷_实时电商项目_实付分摊介绍

350

123

11分37秒

123_尚硅谷_实时电商项目_从Kafka中读取订单明细数据

330

124

21分24秒

124_尚硅谷_实时电商项目_维度表的创建

350

125

19分9秒

125_尚硅谷_实时电商项目_维度数据处理代码实现

370

126

13分32秒

126_尚硅谷_实时电商项目_订单明细和商品维度关联

350

127

10分58秒

127_尚硅谷_实时电商项目_订单明细和维度关联测试

340

128

18分40秒

128_尚硅谷_实时电商项目_订单和订单明细数据写回Kafka

330

129

26分24秒

129_尚硅谷_实时电商项目_OrderWideApp接收双流数据测试

310

130

27分52秒

130_尚硅谷_实时电商项目_双流Join问题解决方案

310

131

28分8秒

131_尚硅谷_实时电商项目_双流Join代码实现

300

132

12分57秒

132_尚硅谷_实时电商项目_双流合并测试

330

133

18分35秒

133_尚硅谷_实时电商项目_实付分摊需求

370

134

9分38秒

134_尚硅谷_实时电商项目_实付分摊思路介绍

380

135

35分10秒

135_尚硅谷_实时电商项目_实付分摊代码实现

360

136

7分38秒

136_尚硅谷_实时电商项目_实付分摊测试

360

137

27分10秒

137_尚硅谷_实时电商项目_内容回顾

400

138

18分53秒

138_尚硅谷_实时电商项目_ClickHouse介绍

420

139

7分21秒

139_尚硅谷_实时电商项目_安装前准备工作

380

140

16分20秒

140_尚硅谷_实时电商项目_单机安装

370

141

20分46秒

141_尚硅谷_实时电商项目_数据类型

330

142

22分55秒

142_尚硅谷_实时电商项目_三个属性讲解

360

143

9分43秒

143_尚硅谷_实时电商项目_二级索引

390

144

7分19秒

144_尚硅谷_实时电商项目_TTL设置

360

145

10分18秒

145_尚硅谷_实时电商项目_ReplacingMergeTree

340

146

8分46秒

146_尚硅谷_实时电商项目_SummingMergeTree

280

147

16分29秒

147_尚硅谷_实时电商项目_SQL操作

400

148

16分20秒

148_尚硅谷_实时电商项目_副本

400

149

15分6秒

149_尚硅谷_实时电商项目_分片的读取和写入流程

370

150

20分25秒

150_尚硅谷_实时电商项目_分片集群配置

290

151

19分50秒

151_尚硅谷_实时电商项目_保存双流Join后的数据到ClickHouse中1

400

152

25分21秒

152_尚硅谷_实时电商项目_保存双流Join后的数据到ClickHouse中2

330

153

11分21秒

153_尚硅谷_实时电商项目_数据接口架构介绍

380

154

9分40秒

154_尚硅谷_实时电商项目_配置文件属性说明

380

155

17分19秒

155_尚硅谷_实时电商项目_Mapper接口的创建

430

156

8分46秒

156_尚硅谷_实时电商项目_Mapper配置文件说明1

400

157

15分47秒

157_尚硅谷_实时电商项目_没有得到分摊数据问题排查

380

158

15分54秒

158_尚硅谷_实时电商项目_MyBatis映射文件配置

350

159

18分23秒

159_尚硅谷_实时电商项目_上午内容回顾

320

160

19分15秒

160_尚硅谷_实时电商项目_Service层处理代码

330

161

19分40秒

161_尚硅谷_实时电商项目_Controller层处理代码及测试

380

162

17分23秒

162_尚硅谷_实时电商项目_ADS层聚合思路

300

163

16分18秒

163_尚硅谷_实时电商项目_数据库表创建以及查询MySQL工具类封装

390

164

9分9秒

164_尚硅谷_实时电商项目_从MySQL中获取偏移量的工具类封装

320

165

15分9秒

165_尚硅谷_实时电商项目_将数据写回到Kafka

420

166

31分30秒

166_尚硅谷_实时电商项目_内容回顾

420

167

30分51秒

167_尚硅谷_实时电商项目_从Kafka中读取dws层数据

300

168

5分16秒

168_尚硅谷_实时电商项目_scalikejdbc工具介绍

320

169

25分53秒

169_尚硅谷_实时电商项目_保存数据到MySQL（精准一次性第二种实现）

380

170

16分56秒

170_尚硅谷_实时电商项目_发布数据接口程序介绍

410

171

14分38秒

171_尚硅谷_实时电商项目_抽取方法避免踩坑

390

172

17分17秒

172_尚硅谷_实时电商项目_发布数据查询接口

360

173

36分36秒

173_尚硅谷_实时电商项目_DataV数据展示

470

174

37分47秒

174_尚硅谷_实时电商项目_阶段总结

340

094_尚硅谷_实时电商项目_内容回顾

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐