00:00
接下来我们看一个对于RODB的调整,叫预定义选项,那一般呢,其实咱们呃使用RODB到这一步一般也就差不多了,那像后面什么5678这些是三搞不定的时候你再去调的,哎呀,看到。什么意思呢?Lost DB本身是个数据库,大家应该都知道对吧?那么当然flink用起来很方便,哎,不用咱们去什么部署,它是自动内置内嵌的,他自己来管理的。那么如果呢?咱们单纯去用RODB这个东西啊,咱们可以调整的参数那是几十上百个参数啊。那用起来相对来讲,呃,门槛还是有一定的,一定门槛,你要对它比较了解,那么多参数你怎么去调对吧,那flink就考虑到这一点,所以DOSDB还记得内存里面它用在哪里吗?是不是托管内存呢?哎,来,我们翻一下。
01:00
是不是在管理内存这一块?管理内存什么意思呢?就是由link帮咱们来管理DB。那么既然要管理,他也得设一些参数,它就相对应的可能有一些不同的策略。那它这边是叫预定义选项,就是说它有这么多种策略给咱们用,那其中每一种策略它对应的就是不同的RODB参数。它这些参数都是不一样的,就不同策略下,也就是说它自动呢,帮我们调整好了,看哪一个适合。对吧,基本上咱们条约的话,到这一步就差不多了。那我们看看它支持的预定义选项,有default,你啥都不管,不设置就default,那还有什么呢?基于磁盘的优化,基于什么磁盘和内存的优化?基于什么固态的优化?对吧,这个就涉及到你当前的机器服务器啊,也就是说你服务器的磁盘。
02:01
呃,内存资源够不不够,不够的话,那就基于磁盘,那如果基于磁盘又分为普通机械盘跟那个类似固态的对吧,快速的固态盘。它都有不同的参数。那正常来讲,一般的内存还是比较贵的,咱们还不够,不至于那么奢侈。对吧,那所以呢。如果你有钱,你上的全是固态,那你可以指定为预定义选项SSD的,那么大部分人来讲应该是选择这个磁盘加内存啊,这是比较综合性来考虑的,那这个预定义选项咱们在参数里面去指定一下就行了。那它到底给我们产生什么作用,带大家看一下,呃,代码。预定X项的话。咱们还是从代码看一看吧啊,毕竟咱们要了解一下到底帮我们做了什么事,呃,这个代码里面有其他关掉啊。
03:06
咱们不是另了一个状态后端吗,然后把它提出来。我们利用了这个状态,后端是可以去set。在set里面大家就可以看到有一个pretty options。预定预定选项点进来,呃,这个方法带大家瞅一眼,他传参传的是这么一个类,是一个枚举。点进来你看是一个枚举,那枚举里面它提供了这么几种,C诺L加F12抽验。这么四种就是咱们文档列出来的四种,那默认就是default,大家可以看到这个default很短。啥也没做对吧。啊。接下来。你看下面。这是什么?基于磁盘的,对不对,基于磁盘它把我们。这的一个什么重量的并行度是四,也就是说某不不是并行度啊对,呃,并行度也就它的一个线程工作线程默认把我们设成了四。
04:11
然后最大的打开文件数负一表示不限制,这个就是Li那个u limit去看嘛。文件描述符的限制,这个应该大家很熟了啊,也不是很熟就应该碰到过啊。负一就不限制啊。好,那你再看往下。这个是什么,就咱们建议和推荐的那个磁盘加内存这个东西呢,你看除了这个设置之外,什么四个线程不限制之外,下面还有一堆东西。它自动帮我们使用了一些他觉得比较好的一些参数,比如说什么broke catch size啊,就是一个快缓冲的,快缓冲的一个大小,还有每块大小。还有文件大小,还有一个什么写缓冲区对吧,Right buffer大小,你看这都是它写死的值啊。
05:04
就是这个策略,然后呢,将这些值怎么样set进去。就是他。一些。自动帮我们设的一些参数,那这样的话就是不是就很省事儿了,对吧,那你再看看那个基于SSD的,它同样的下面。还有一堆东西啊。嗯。那我们所以呢,一般我们就是改成这个选项啊。就行了。现在大家都应该都明白啊,那或者呢,这个可以在代码里指定,怎么指定呢,我写一遍吧。就在这嘛,预定义选项,然后呢,选择这个。Disc和memory啊,然后再把这个状态后端传进去,这样也就行了。
06:05
这样就O了,这就调优了啊,这就是信赖flink的经验吧啊。住掉了啊,那如果你不在代码写子也OK啊,你是不是可以杠大地啊?在这里指定也可以。嗯。就是这玩意儿。然后等于。一个选项。就OK了啊,你提交参数也可以这么来写。这个就是咱们一般来讲。的一个调就到这里差不多了,那么如果到这一步还不行。使用这个预定选项效果还不理想,你还想调也可以,那你那些参数就要自己调了。那就是后面咱们要看的内容。
我来说两句