文章/答案/技术大牛

发布

首页视频14_尚硅谷_Kafka_生产者_分区

14_尚硅谷_Kafka_生产者_分区

2022-12-022022-12-02 16:02:03播放43

点赞0 收藏 0

尚硅谷大数据技术之Kafka3.x（2022版）/视频/14_尚硅谷_Kafka_生产者_分区.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，我们来看一下生产者分区，那首先我们来到这个发送原理这块啊，把这张图呢给它钉出来。定出来之后，我们再回来。那回来干什么呢？嗯，大家看一下。这是外部的数据过来之后，我们是经过散的方法进行往外发送啊，而且散的方法里面还有带这个回调的，以及呢，还有同步发送，是这样吗？哎，相当于数据呢，走到这儿，走到这儿之后，现在我们走到生产者，哎生产者分区是在这儿。那走到这，那前面这个拦截器和这个序列化器为什么没讲呢。哎，之前在讲这块的时候，大概给大家说了一下，说这个拦截器啊，其实在生产环境当中我们用的并不多，哎，主要呢，是这个用这个flu的对应的拦截器相对说要多一些。那这个呢，哎，我们就不讲了，那下面这个蓄热化器，蓄热化器啊，哎，由于我们通常情况下在企业里面传输的数据类型呢，都是实训这种类型啊，也就是说很少去自定义，也说这块呢，哎，我们暂时呢啊，也不考虑给大家去讲啊，那之后呢，我们的数据呢，就已经走到了对应的这个分区器。
01:07
所以说我们就详细的研究一下这个分区器，那首先看的第一个就是分区器的好处。放机。打开首先第一个好处。大家想摆在我面前的是100T的这个数据。这么大量的数据，如果说放到一台服务器上，那很难单独的去进行一个存储，那我们就想如何把它切割成一块一块的，那这时候呢，分区就引入进来了。它可以合理的使用存储资源，让我们每一个分区在一个博上进行存储，可以把海量的数据按照分区切割成一块一块。比如说这里面，我把它这个100G的数据啊，切割成三块。放在三台服务器上，每台呢承担33T左右。那这不就OK了吗？
02:02
是吧，哎，行，那这是这个好处，那同学说海哥你切割成33T，那每台服务器的压力还是很大呀，那不用担心33T的数据啊，下面呢，它在存储的时候还是按照1G一块啊进行分割存储，那后面讲存储原理的时候再给大家详细说啊，总之我们能把海量的数据先按照。分区先切上那么一刀，行。这是这块，那大家在想后半句说合理的控制这个分区任务啊，可以实现负载均衡，那它怎么实现的呢？其实在企业里面有这种情况，比如说第一台服务器啊，能够存储的这个硬盘是1T，第二台服务器呢100T，第三台服务器也是100T硬盘。那如果是这样的情况下，我这100T的资源如何均匀的分布在博客零，博客一，博客二上呢？那这时候我们就要根据每台服务器的存储能力，是适当的进行控制数据的一个存储啊，哎，那这时候你就可以对这个分区进行自定义。
03:04
我让这个一号分区和二号分区多存储一些数据，让零号分区少存储一些数据，那是不是就起到了一个负载均衡的一个目的。啊，就是这样的哈，就是从存储的角度呢，让我们存储的更加灵活啊，这是分区的第一个好处。那么在大数据场景下啊，分析一个问题，除了从存储的角度去考虑，还需要从计算的角度去考虑啊，那好我们来看一下。那首先呢，如果说这块我们采用分区的话，它能够提高生产者往这个博客集群发送的一个并行度。你想如果是100T的这个数据发往到一个broke。那你最多一个县城对不对，那这个速度呢，非常慢，但反过来我100G的数据，我可以往这发，可以往这发，可以往这发。我多增加几台服务器，那我的并行度就大大的提高了，那我传输的这个效率啊也就提高了。那好，那从那个消费的角度，同样道理，如果你是数据只放到一个分区里面，就说这里面是100T。
04:07
所有数据都打到这儿。那么你一个消费者来消费的话，这个消费速度就非常非常慢，那反过来我把100G的数据分割进行存储，存储在不同的服务器上，那我就可以组成一个消费者组。哎，每一个消费者呢，消费其中一部分。那我这个处理速度不就更快了。所以从这个存储和计算的角度来说，这个分区啊，都有大大的好处啊，所以说这个分区在企业里面呢，用的是非常非常多的啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Kafka3.x（2022版）

（14/96）

4分52秒

01_尚硅谷_Kafka_课程简介

550

6分21秒

02_尚硅谷_Kafka_概述_定义

430

7分35秒

03_尚硅谷_Kafka_概述_消息队列应用场景

510

3分47秒

04_尚硅谷_Kafka_概述_消息队列两种模式

480

9分39秒

05_尚硅谷_Kafka_概述_基础架构

480

15分36秒

06_尚硅谷_Kafka_入门_安装Kafka

610

4分33秒

07_尚硅谷_Kafka_入门_启动停止脚本

490

10分58秒

08_尚硅谷_Kafka_入门_Topic命令

530

5分9秒

09_尚硅谷_Kafka_入门_命令行操作

430

13分48秒

10_尚硅谷_Kafka_生产者_原理

500

12分15秒

11_尚硅谷_Kafka_生产者_异步发送

430

3分20秒

12_尚硅谷_Kafka_生产者_回调异步发送

320

2分21秒

13_尚硅谷_Kafka_生产者_同步发送

420

4分38秒

14_尚硅谷_Kafka_生产者_分区

430

11分17秒

15_尚硅谷_Kafka_生产者_分区策略

400

4分55秒

16_尚硅谷_Kafka_生产者_自定义分区

390

11分0秒

17_尚硅谷_Kafka_生产者_提高生产者吞吐量

390

14分0秒

18_尚硅谷_Kafka_生产者_数据可靠

350

15分5秒

19_尚硅谷_Kafka_生产者_数据重复

420

2分11秒

20_尚硅谷_Kafka_生产者_数据有序

310

4分47秒

21_尚硅谷_Kafka_生产者_数据乱序

370

6分0秒

22_尚硅谷_Kafka_Broker_ZK存储

450

5分21秒

23_尚硅谷_Kafka_Broker_工作原理

420

1分25秒

24_尚硅谷_Kafka_Broker_上下线

360

7分26秒

25_尚硅谷_Kafka_Broker_服役新节点（上）

350

7分24秒

26_尚硅谷_Kafka_Broker_服役新节点（下）

410

5分18秒

27_尚硅谷_Kafka_Broker_退役旧节点

400

16分4秒

28_尚硅谷_Kafka_每日回顾（上）

310

24分24秒

29_尚硅谷_Kafka_每日回顾（下）

460

4分18秒

30_尚硅谷_Kafka_Broker_副本基本信息

360

10分1秒

31_尚硅谷_Kafka_Broker_Leader选举

360

5分53秒

32_尚硅谷_Kafka_Broker_Follower故障

430

1分56秒

33_尚硅谷_Kafka_Broker_Leader故障

400

6分26秒

34_尚硅谷_Kafka_Broker_分区副本分配

400

4分40秒

35_尚硅谷_Kafka_Broker_手动调整分区副本分配

330

5分57秒

36_尚硅谷_Kafka_Broker_LeaderPartition负载平衡

460

2分57秒

37_尚硅谷_Kafka_Broker_增加副本因子

370

12分49秒

38_尚硅谷_Kafka_Broker_文件存储机制

460

8分33秒

39_尚硅谷_Kafka_Broker_文件清除策略

350

7分58秒

40_尚硅谷_Kafka_Broker_高效读写

310

2分52秒

41_尚硅谷_Kafka_消费者_消费方式

320

4分54秒

42_尚硅谷_Kafka_消费者_消费者总体工作流程

410

5分26秒

43_尚硅谷_Kafka_消费者_消费者组工作原理

250

6分48秒

44_尚硅谷_Kafka_消费者_消费者组初始化

390

4分1秒

45_尚硅谷_Kafka_消费者_消费者组详细消费流程

360

9分34秒

46_尚硅谷_Kafka_消费者_消费一个主题

410

6分37秒

47_尚硅谷_Kafka_消费者_消费一个分区

280

3分25秒

48_尚硅谷_Kafka_消费者_消费者组案例

460

12分58秒

49_尚硅谷_Kafka_消费者_Range分配

380

6分48秒

50_尚硅谷_Kafka_消费者_Roundrobin

360

5分51秒

51_尚硅谷_Kafka_消费者_Sticky

390

7分32秒

52_尚硅谷_Kafka_消费者_offset保存位置

420

4分41秒

53_尚硅谷_Kafka_消费者_自动offset

350

4分33秒

54_尚硅谷_Kafka_消费者_手动offser

360

9分42秒

55_尚硅谷_Kafka_消费者_指定offset

340

5分47秒

56_尚硅谷_Kafka_消费者_按照时间消费

420

4分3秒

57_尚硅谷_Kafka_消费者_消费者事务

390

3分6秒

58_尚硅谷_Kafka_消费者_数据积压

500

17分15秒

59_尚硅谷_Kafka_每日回顾（上）

420

17分41秒

60_尚硅谷_Kafka_每日回顾（下）

420

4分31秒

61_尚硅谷_Kafka_监控_MySQL环境准备

390

2分21秒

62_尚硅谷_Kafka_监控_Kafka环境准备

480

6分37秒

63_尚硅谷_Kafka_监控_Kafka-Eagle安装

370

5分6秒

64_尚硅谷_Kafka_监控_Kafka-Eagle监控页面

410

14分56秒

65_尚硅谷_Kafka_Kraft模式

430

7分43秒

66_尚硅谷_Kafka_集成_Flume环境准备

430

9分0秒

67_尚硅谷_Kafka_集成_Flume生产者

360

6分57秒

68_尚硅谷_Kafka_集成_Flume消费者

440

10分15秒

69_尚硅谷_Kafka_集成_Flink生产者

390

5分5秒

70_尚硅谷_Kafka_集成_Flink消费者

360

9分34秒

71_尚硅谷_Kafka_集成_SpringBoot生产者

360

4分11秒

72_尚硅谷_Kafka_集成_SpringBoot消费者

340

8分46秒

73_尚硅谷_Kafka_集成_Spark生产者

410

12分38秒

74_尚硅谷_Kafka_集成_Spark消费者

390

2分39秒

75_尚硅谷_Kafka_调优_内容简介

350

18分6秒

76_尚硅谷_Kafka_调优_硬件选择

370

9分34秒

77_尚硅谷_Kafka_调优_生产者调优

300

10分49秒

78_尚硅谷_Kafka_调优_Broker调优

350

9分14秒

79_尚硅谷_Kafka_调优_消费者调优

350

11分22秒

80_尚硅谷_Kafka_调优_总体调优

380

15分35秒

81_尚硅谷_Kafka_调优_生产者压力测试

350

5分44秒

82_尚硅谷_Kafka_调优_消费者压力测试

370

5分35秒

83_尚硅谷_Kafka_源码_环境准备

340

2分53秒

84_尚硅谷_Kafka_源码_生产者原理回顾

270

24分32秒

85_尚硅谷_Kafka_源码_生产者初始化

330

20分13秒

86_尚硅谷_Kafka_源码_生产者发送数据到缓存

350

14分42秒

87_尚硅谷_Kafka_源码_生产者Sender线程

340

4分53秒

88_尚硅谷_Kafka_源码_消费者原理回顾

360

19分31秒

89_尚硅谷_Kafka_源码_消费者初始化

340

5分14秒

90_尚硅谷_Kafka_源码_消费者订阅主题

350

2分56秒

91_尚硅谷_Kafka_源码_消费总体流程

300

5分58秒

92_尚硅谷_Kafka_源码_消费者组初始化流程

410

10分7秒

93_尚硅谷_Kafka_源码_消费者组拉取和处理数据

360

2分51秒

94_尚硅谷_Kafka_源码_消费者Offset提交

390

6分56秒

95_尚硅谷_Kafka_源码_服务器端源码

390

1分54秒

96_尚硅谷_Kafka_课程结束

410

14_尚硅谷_Kafka_生产者_分区

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐