文章/答案/技术大牛

发布

首页视频16_尚硅谷_Kafka_生产者_自定义分区

16_尚硅谷_Kafka_生产者_自定义分区

2022-12-022022-12-02 16:02:03播放39

点赞0 收藏 0

尚硅谷大数据技术之Kafka3.x（2022版）/视频/16_尚硅谷_Kafka_生产者_自定义分区.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，下节课我们是详细讲解了生产者的分区分配策略，那么这种分区分配策略不能满足所有的这种生产环境要求。在一些工作当中啊，有一些特殊场景。那比如说我们前面过来的数据，有非常非常多的数据，我们希望从这么多数据当中过滤出来，诶国际上知名的网站，比如说爱圭。那么过滤出来的艾特硅谷，我要把它发送到零号分区。那么不包含艾特硅谷的信息呢？诶，发送到一号分区。就实现这样一个功能。那这时候呢，就需要我们自己去自定义分析器来实现，那其实自定义分析器啊，也非常简单啊，那我们。复制一下。好，来到这里面呢，我们创建一个类。叫my part，然后呢，实现一个接口，就是parter接口。
01:00
奥特加飞车。诶，重写里面对应的方法，那这里面最核心的方法就是这个帕森方法。那这里对应的参数大家大概看一下啊，第一个呢是主题是吧，那你数据发生了哪个主题之后呢，是key以及value，那么这两个什么呢？这两个是序列化之后的T和序列化之后的Y流值，那这里面我们用这个就可以了啊啊以及这个啊。行，那我们来处理一下。首先你过来的数据。获取数据，你过来的数据啊，都是object类型对吧？哎，那我们把这个value拿过来处理它。卖了。第二他传过来的是不是实际类型啊，因为它传过来正常不是这样信息吗？二硅谷或者是哈喽是吧啊。转换一下。强转转成这个MSG。跟着他。
02:00
转成它之后，那下面我们进行一个判断，说if。这个mass values。Contains。如果里面包含对应的艾。那怎么办呢？把这个国际上知名的公司。那发送到零号分区，那零号分区我是不是得定一个变量啊。零变亮特。那这个part呢，发到零号分区，它就等于零。哎。哎，我们就给它发送到一号分区，不管你是谁的数据。好，那这个分区呢，放到这儿啊，别忘了修改。这不就OK了吗？那这个写完了，大家思考一个问题，你看这个地方呢，它是灰色代码。也就说，你这个自定义的分区器，如何跟我们前面的生产者产生爱恨情仇呢？那怎么办？好，那复制他权利名呗。Copy陈立明。
03:00
那我们拿到哪里哈，拿到这个这个吧，Call back partan啊来这里面。来到这里面来看一下。这个地方是采用的呃，最原始的topic和对应的value对吧，发送的，那么这个值在哪放呢？在最前面。关联。自定义分区七。点put，然后producer。很点，那这里面哪一个参数是我们管分区的呢？你打一个P。那这里面就是part class。把它替换，因为默认它走的是default哈。赶紧来。这就是我们自定义分区器的全类名，往这一放，那么这个分区器就跟我们这个代码产生了关联。那它有没有用呢？试一下呗，好。那么我们接下来发送的这份数据里面是不包含at规模啊，那应该发送到哪一个分区呢？
04:02
是不是应该发生到零二分之，那试一下是不是。你看50条数据都发往了零号分区，那好，那这边我们不让他报股。我发送哈，那你说这个哈，它没有阿股，应该发送到一号分区。看看行不行啊。你看现在这波数据就已经发送到一号分区了啊，这个呢，就是自定义分析器来实现我们想要的一些特殊功能，其实在企业里面啊，呃，除了像这种过滤这个艾特相关的数据，其实还可以过滤一些，比如说张数据。哎，我在生产环境当中啊，这波数据呢，我根据我的这个判断说，诶这个校验规则不符合要求的，我发往到指定的这个分区里面进行处理，哎，这也是可以的啊，所以制定分析器呢，还是非常重要的。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Kafka3.x（2022版）

（16/96）

4分52秒

01_尚硅谷_Kafka_课程简介

550

6分21秒

02_尚硅谷_Kafka_概述_定义

430

7分35秒

03_尚硅谷_Kafka_概述_消息队列应用场景

510

3分47秒

04_尚硅谷_Kafka_概述_消息队列两种模式

480

9分39秒

05_尚硅谷_Kafka_概述_基础架构

480

15分36秒

06_尚硅谷_Kafka_入门_安装Kafka

610

4分33秒

07_尚硅谷_Kafka_入门_启动停止脚本

490

10分58秒

08_尚硅谷_Kafka_入门_Topic命令

530

5分9秒

09_尚硅谷_Kafka_入门_命令行操作

430

13分48秒

10_尚硅谷_Kafka_生产者_原理

500

12分15秒

11_尚硅谷_Kafka_生产者_异步发送

430

3分20秒

12_尚硅谷_Kafka_生产者_回调异步发送

320

2分21秒

13_尚硅谷_Kafka_生产者_同步发送

420

4分38秒

14_尚硅谷_Kafka_生产者_分区

430

11分17秒

15_尚硅谷_Kafka_生产者_分区策略

400

4分55秒

16_尚硅谷_Kafka_生产者_自定义分区

390

11分0秒

17_尚硅谷_Kafka_生产者_提高生产者吞吐量

390

14分0秒

18_尚硅谷_Kafka_生产者_数据可靠

350

15分5秒

19_尚硅谷_Kafka_生产者_数据重复

420

2分11秒

20_尚硅谷_Kafka_生产者_数据有序

310

4分47秒

21_尚硅谷_Kafka_生产者_数据乱序

370

6分0秒

22_尚硅谷_Kafka_Broker_ZK存储

450

5分21秒

23_尚硅谷_Kafka_Broker_工作原理

420

1分25秒

24_尚硅谷_Kafka_Broker_上下线

360

7分26秒

25_尚硅谷_Kafka_Broker_服役新节点（上）

350

7分24秒

26_尚硅谷_Kafka_Broker_服役新节点（下）

410

5分18秒

27_尚硅谷_Kafka_Broker_退役旧节点

400

16分4秒

28_尚硅谷_Kafka_每日回顾（上）

310

24分24秒

29_尚硅谷_Kafka_每日回顾（下）

460

4分18秒

30_尚硅谷_Kafka_Broker_副本基本信息

360

10分1秒

31_尚硅谷_Kafka_Broker_Leader选举

360

5分53秒

32_尚硅谷_Kafka_Broker_Follower故障

430

1分56秒

33_尚硅谷_Kafka_Broker_Leader故障

400

6分26秒

34_尚硅谷_Kafka_Broker_分区副本分配

400

4分40秒

35_尚硅谷_Kafka_Broker_手动调整分区副本分配

330

5分57秒

36_尚硅谷_Kafka_Broker_LeaderPartition负载平衡

460

2分57秒

37_尚硅谷_Kafka_Broker_增加副本因子

370

12分49秒

38_尚硅谷_Kafka_Broker_文件存储机制

460

8分33秒

39_尚硅谷_Kafka_Broker_文件清除策略

350

7分58秒

40_尚硅谷_Kafka_Broker_高效读写

310

2分52秒

41_尚硅谷_Kafka_消费者_消费方式

320

4分54秒

42_尚硅谷_Kafka_消费者_消费者总体工作流程

410

5分26秒

43_尚硅谷_Kafka_消费者_消费者组工作原理

250

6分48秒

44_尚硅谷_Kafka_消费者_消费者组初始化

390

4分1秒

45_尚硅谷_Kafka_消费者_消费者组详细消费流程

360

9分34秒

46_尚硅谷_Kafka_消费者_消费一个主题

410

6分37秒

47_尚硅谷_Kafka_消费者_消费一个分区

280

3分25秒

48_尚硅谷_Kafka_消费者_消费者组案例

460

12分58秒

49_尚硅谷_Kafka_消费者_Range分配

380

6分48秒

50_尚硅谷_Kafka_消费者_Roundrobin

360

5分51秒

51_尚硅谷_Kafka_消费者_Sticky

390

7分32秒

52_尚硅谷_Kafka_消费者_offset保存位置

420

4分41秒

53_尚硅谷_Kafka_消费者_自动offset

350

4分33秒

54_尚硅谷_Kafka_消费者_手动offser

360

9分42秒

55_尚硅谷_Kafka_消费者_指定offset

340

5分47秒

56_尚硅谷_Kafka_消费者_按照时间消费

420

4分3秒

57_尚硅谷_Kafka_消费者_消费者事务

390

3分6秒

58_尚硅谷_Kafka_消费者_数据积压

500

17分15秒

59_尚硅谷_Kafka_每日回顾（上）

420

17分41秒

60_尚硅谷_Kafka_每日回顾（下）

420

4分31秒

61_尚硅谷_Kafka_监控_MySQL环境准备

390

2分21秒

62_尚硅谷_Kafka_监控_Kafka环境准备

480

6分37秒

63_尚硅谷_Kafka_监控_Kafka-Eagle安装

370

5分6秒

64_尚硅谷_Kafka_监控_Kafka-Eagle监控页面

410

14分56秒

65_尚硅谷_Kafka_Kraft模式

430

7分43秒

66_尚硅谷_Kafka_集成_Flume环境准备

430

9分0秒

67_尚硅谷_Kafka_集成_Flume生产者

360

6分57秒

68_尚硅谷_Kafka_集成_Flume消费者

440

10分15秒

69_尚硅谷_Kafka_集成_Flink生产者

390

5分5秒

70_尚硅谷_Kafka_集成_Flink消费者

360

9分34秒

71_尚硅谷_Kafka_集成_SpringBoot生产者

360

4分11秒

72_尚硅谷_Kafka_集成_SpringBoot消费者

340

8分46秒

73_尚硅谷_Kafka_集成_Spark生产者

410

12分38秒

74_尚硅谷_Kafka_集成_Spark消费者

390

2分39秒

75_尚硅谷_Kafka_调优_内容简介

350

18分6秒

76_尚硅谷_Kafka_调优_硬件选择

370

9分34秒

77_尚硅谷_Kafka_调优_生产者调优

300

10分49秒

78_尚硅谷_Kafka_调优_Broker调优

350

9分14秒

79_尚硅谷_Kafka_调优_消费者调优

350

11分22秒

80_尚硅谷_Kafka_调优_总体调优

380

15分35秒

81_尚硅谷_Kafka_调优_生产者压力测试

350

5分44秒

82_尚硅谷_Kafka_调优_消费者压力测试

370

5分35秒

83_尚硅谷_Kafka_源码_环境准备

340

2分53秒

84_尚硅谷_Kafka_源码_生产者原理回顾

270

24分32秒

85_尚硅谷_Kafka_源码_生产者初始化

330

20分13秒

86_尚硅谷_Kafka_源码_生产者发送数据到缓存

350

14分42秒

87_尚硅谷_Kafka_源码_生产者Sender线程

340

4分53秒

88_尚硅谷_Kafka_源码_消费者原理回顾

360

19分31秒

89_尚硅谷_Kafka_源码_消费者初始化

340

5分14秒

90_尚硅谷_Kafka_源码_消费者订阅主题

350

2分56秒

91_尚硅谷_Kafka_源码_消费总体流程

300

5分58秒

92_尚硅谷_Kafka_源码_消费者组初始化流程

410

10分7秒

93_尚硅谷_Kafka_源码_消费者组拉取和处理数据

360

2分51秒

94_尚硅谷_Kafka_源码_消费者Offset提交

390

6分56秒

95_尚硅谷_Kafka_源码_服务器端源码

390

1分54秒

96_尚硅谷_Kafka_课程结束

410

16_尚硅谷_Kafka_生产者_自定义分区

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐