00:00
好,然后我们看第二大块就是它的一个存储存储,它存储分为两个地方吧,第一个是本地对吧,哎,本地本地那个存储其实就是一个一个的topic。啊,一个一个,他没有第二个地方呢。从K播里边吧,还从K播里边存了一部分数据啊,这个两个地方呢,我们都要带着大家看一看,它到底里边存的什么东西,存在什么东西,OK,呃,因为我们这个first这个东西啊,是刚创建的对吧。没有任何东西,我启动一个生产者,生产点,数据放在里边,卡不卡?Producer,杠杠。Or?杠list,然后哈逗102冒号端口。9092对吧,端号稍微记一记端号,然后你要往哪个topic生产数据对吧,First。好,然后来一个什么哈。
01:04
二的硅谷那个OK,生产两条数据,生产两条数据之后啊,我们来看一下它的一个数据。啊,看一下数据,这里面数据呢,它进行了一个序列化,序列化,所以呢,你看到的会有一些乱码,我们进到这个FO0里边。First里边,它这里边呢,会有什么index,我们核心要关注的是这个。什么点logo这个东西呢,是它实际的一个存储数据的一个文件,来我们看一下看一下。看看不太清楚,但是你能看到这个东西吧,刚才是不是我们说的哈,还没输完对吧。啊,这个地方就是它实际存储数据的一个地方,因为它进行了一个序列化啊,进行一个序列化,所以你看这把把这个前面这个东西都弄乱了,对吧,但是我们能感觉到,哎,这个地方是实际的一个输据的一个存储位置吧,哎,我们自己输的啊,自己输的一个地方啊,这块要注意一下。
02:07
这第一个它实际的数据存在哪,就是说它存在当前这个partition那个文件夹下有一个什么。点log。这个文件吧,哎,它是存在这个里边的啊,存在这个里边,这是它在磁盘上存储的一个位置,OK,然后接下来。还有存储策略这个东西是时间啊,它的一个什么大小啊,大小是之前在那个配置的时候,大家看了吧,啊,这是存储的一个,就是说它什么时候会删,什么时候删,然后第二个K里边。哎,我们要看一下它那个信息了,这样我们进到组K里边对吧。如K的一个客户端是。Client对吧,点SH。LS跟。哎,一下子这么多啊,这么多OK,它首先有一个这个brook。
03:06
我们之前是不是提过卡夫卡它跟卢K沃核心的两个东西,一个是卡夫卡集群,一个是消费者,对吧?诶这两个东西OK,那首先我们看一下这个卡普卡提群,它其实就是这个节点。是吧,来进来。LS看它下面有什么有什么。Ids,还有一个是序列化的ID,那前面两个东西ID你想想看应该存的是什么?Broke的一个ID吧,对吧,哎,也就是说它这个地方呢,管理你的集群的。管理集群的来看一下。哎。012对吧,哎,三个节点,那我们看一下这个零。没有子节点了,没有子节点我们就应该怎么看。
04:03
Get吧。那你想想看,这里边应该存的是什么呢?哈多102呀,对吧,你那不是零不是哈多102嘛,啊,它那个数据肯定哈多102以及什么端口号对吧,9092啊存在是这些信息,那相应的一和二就不用看了吧,还是一样的,那接下来这是ids ID就是说如K里边呢,存在你这个卡法集群,整个一个节点有谁对吧?它整个的把你组成了一个集群,然后第二个是什么。跟还有一个,那你想看这里面存的是什么呢。学校。就逃对吧,哎,两个逃。对吧,一个first,一个是那个系统的,那我们进到这个first里边看它有什么呢?另外这个first底下应该是什么。Partitions对吧,哎,分区partition走只有一个分区在接着进。
05:04
Status来再接着status对吧,这个目路还挺深的吧,一级一级直动status下面没有节点了,那说明应该用。Get对吧,哎,Get来获取一下这个state的一个state状态对吧,就是说零号这个分区啊,我需要看一下它这个所谓这个值。这包存的是什么?是不是我们describe看出来的一个东西啊,他的leader是谁?副本在哪,SR怎么样的。SR什么样的,对吧,因为我们当前这个是不是设置了一个分区三个副本啊,对吧?啊,一个分区三个副本,所以呢,三个副本都放在这,都放在这啊,它就是我们看到的describe,看出来的一个消息,看到一个消息,OK,这就是我们进到这个broke里边,当前这个节点下,我们需要关注的几个东西。啊,我们都能看到,首先是卡巴集群,它有哪几个节点组成的,第二就是它这个topic有哪些,对吧?然后topic每个分区它是什么,Leader是谁,然后副本有哪些SR,就是他的个选举,哎准备选举的一个情况是什么样的,哎都在同学们组着呢,都会怎么OK,除了这个之外,我们还关注一个。
06:22
不需外也有的。那个东西不用关注,不用关注,我们核心的关注ids跟这个topics。然后还有一个。Consumers consumers这个东西啊,我们需要了解到。那想想看,这里边就是我们当时提到存的是什么东西啊?啊。Council。对,这个就是它的一个阻YD。阻碍力,我们这些是不是提过,它会随机给他生成一个什么。
07:02
数字吧,啊,随机生成一个数字。因为你并没有指定它这个阻ID是谁啊,哎,所以它随机生成一个,OK,那我们随便挑一个。然后来一个这个八,这个来看一下它里边有一个什么节点啊。奥的偏移量吗?之前我们就提过,康在做黑存的,不就是便移量吗?就上一次消费到哪吗来?红色的。是关于first这个吧,对吧,也就是说一个消费者我不仅可以消费first,我是不是还可以消费seven呢?色的我可以同时消费,也可以我这会儿消费。First等我我启动的时候,我消费三呢也可以吧,那他都在这个当前这个消费者怎么下存在呢?消费者怎么下存的呢?OK,然后我们再进到这个first里边。分区。然后再进到那个具体的里边。
08:00
没了,没了之后我们应该去用什么?Get,来获取吧。干。嗯,好。二。当时我们发送了四条数据,对吧。哈喽爱硅谷,哈喽哈喽。对吧。是吧,啊,那这个地方是零号分区的,还有一个什么一号分区的也是。两条数据啊,总共大概是不四条两个啊变成四条分成四条,OK,那有同学会有个奇怪的点,因为这个first,现在我们的first是什么。一个分区三个副本啊。是小两词吗?
09:00
对吧,之前这个是我们第一次关于那个first,我们是不是请了一个first。这那个时候他的一个消费者组一个你要注意啊,我们申的是什么。删的是topic,当时我们把那个first删了,重新建的,对吧,就之前是二二嘛,分区数加副本数二二,后面我们改成了一三,还有印象吗?啊,这个应该有印象,那你删除topic,它不会删除这个cons ofet。这个不会删除啊。啊,这个他不删的,就做开里边这个东西他不删。啊,这块要注意一下,注意一下,所以说这个地方看到的二二是我们第一次生产的那个四条数据,第二次其实我们只生产了。两条吧,第二次只生成两条,那我们看一下。是便宜量。偏移量,它这个偏移量是条数,条数的偏移量。
10:02
条数的偏移量,因为你们之前在哈多的那个偏移量指的是一条数据多少个字节这个偏移量法,哎,这个是不一样的,这个是条数的偏移量,就多少调数据是这个意思。啊,它不一样的啊好,那这个里边呢,我们核心关注的就是consumer啊,它里面存的是关于某一个topic下某一个分区的一个offet,对不对啊,一个offet啊,我们要关注这些东西啊,其实用这个图来看的话就是。首先我们要走那个节点。去找到某一个分区,某一个分区的具体的值对吧,然后还有一个什么。Topic一直往下走,还有一个是ids嘛,往下走,我们需要看到什么东西,看到什么东西,OK,这边说这个测试的人。他说没有找到这个节点,大家猜一猜是什么原因呢?
11:04
就是因为它在启动生产者的时候啊,或者说控制台生产的时候,它并没有用杠杠松平这个参数。他用的都是STEM。就是说那你要用的to杠,So,你想。维护到这儿吗?不维护在这吧,哎,维护在那个什么consumer_offset那个topic里边吧,哎,所以说他就看不到那个地方。啊,看不到这个地方啊,这块要注意一下啊,这块要注意一下,因为高版本的时候默认的,或者说你直接用API操作的时候,他建议你就是连那个它那个配置里边就让你写那个什么我to杠。啊,就不让你写那个从K了,就是变直接标记为过时的了,标记为过时的了,所以说你要是没写杠杆素K。它就不会有啊,它就不会有了啊,这个地方就看不到数据了,是这样的啊,因为他将数据存到了那个。
12:00
本地的啊,存在了本地的啊,其实他在那个offs那个topic里边存的也是这些数据啊,是跟那个从存的数据是一样的,是一样的OK。这是整个的什么存储两大块,第一个是本地文件啊,存在那个什么,当前这个分区所在的。文件夹上有一个点log,一个文件啊,它实际的一个存储位置,第二个地方就是我们要关注的,从QQ里面两个节点,一个是consumer,一个是什么broke啊,这两个节点啊,我们需要关注的,需要关注的地方。
我来说两句