前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Kafka快速入门系列(15) | Kafka知识点总结(建议收藏!)

Kafka快速入门系列(15) | Kafka知识点总结(建议收藏!)

作者头像
不温卜火
发布2020-10-28 16:49:13
5010
发布2020-10-28 16:49:13
举报
文章被收录于专栏:不温卜火

1.Kafka中的ISR、AR又代表什么?

  • ISR:与leader保持同步的follower集合
  • AR:分区的所有副本

2.Kafka中的HW、LEO等分别代表什么?

  • LEO:没个副本的最后条消息的offset
  • HW:一个分区中所有副本最小的offset

3.Kafka中是怎么体现消息顺序性的?

  • 每个分区内,每条消息都有一个offset,故只能保证分区内有序。

4.Kafka中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?

  • 拦截器 -> 序列化器 -> 分区器

5.Kafka生产者客户端的整体结构是什么样子的?使用了几个线程来处理?分别是什么?

1
1
2
2

6.“消费组中的消费者个数如果超过topic的分区,那么就会有消费者消费不到数据”这句话是否正确?

  • 正确

7.消费者提交消费位移时提交的是当前消费到的最新消息的offset还是offset+1?

  • offset+1

8. 有哪些情形会造成重复消费?

3
3

9.那些情景会造成消息漏消费?

  • 先提交offset,后消费,有可能造成数据的重复

10.当你使用kafka-topics.sh创建(删除)了一个topic之后,Kafka背后会执行什么逻辑?

  • 1.会在zookeeper中的/brokers/topics节点下创建一个新的topic节点,如:/brokers/topics/first
  • 2.触发Controller的监听程序
  • 3.kafka Controller 负责topic的创建工作,并更新metadata cache

11.topic的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?

可以增加

  • bin/kafka-topics.sh --zookeeper localhost:2181/kafka --alter --topic topic-config --partitions 3

12.topic的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?

  • 不可以减少,被删除的分区数据难以处理。

13.Kafka有内部的topic吗?如果有是什么?有什么所用?

  • 有 __consumer_offsets,保存消费者offset

14.Kafka分区分配的概念?

  • 一个topic多个分区,一个消费者组多个消费者,故需要将分区分配个消费者(roundrobin、range)

15.简述Kafka的日志目录结构?

  • 每个分区对应一个文件夹,文件夹的命名为topic-0,topic-1,内部为.log和.index文件

16.如果我指定了一个offset,Kafka Controller怎么查找到对应的消息?

4
4

17.聊一聊Kafka Controller的作用?

  • 负责管理集群broker的上下线,所有topic的分区副本分配和leader选举等工作。

18.Kafka中有那些地方需要选举?这些地方的选举策略又有哪些?

  • partition leader(ISR),controller(先到先得)

19.失效副本是指什么?有那些应对措施?

  • 不能及时与leader同步,暂时踢出ISR,等其追上leader之后再重新加入

20.Kafka的那些设计让它有如此高的性能?

  • 分区,顺序写磁盘,0-copy

  本次的分享就到这里了

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/05/25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.Kafka中的ISR、AR又代表什么?
  • 2.Kafka中的HW、LEO等分别代表什么?
  • 3.Kafka中是怎么体现消息顺序性的?
  • 4.Kafka中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?
  • 5.Kafka生产者客户端的整体结构是什么样子的?使用了几个线程来处理?分别是什么?
  • 6.“消费组中的消费者个数如果超过topic的分区,那么就会有消费者消费不到数据”这句话是否正确?
  • 7.消费者提交消费位移时提交的是当前消费到的最新消息的offset还是offset+1?
  • 8. 有哪些情形会造成重复消费?
  • 9.那些情景会造成消息漏消费?
  • 10.当你使用kafka-topics.sh创建(删除)了一个topic之后,Kafka背后会执行什么逻辑?
  • 11.topic的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?
  • 12.topic的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?
  • 13.Kafka有内部的topic吗?如果有是什么?有什么所用?
  • 14.Kafka分区分配的概念?
  • 15.简述Kafka的日志目录结构?
  • 16.如果我指定了一个offset,Kafka Controller怎么查找到对应的消息?
  • 17.聊一聊Kafka Controller的作用?
  • 18.Kafka中有那些地方需要选举?这些地方的选举策略又有哪些?
  • 19.失效副本是指什么?有那些应对措施?
  • 20.Kafka的那些设计让它有如此高的性能?
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档