00:00
好,下面呢,我们讲一下这个file input啊,切片机制啊,也是刚才我们读过这个源码之后,那么看一看啊详细的。我们来分析一下它啊。切片机制相当一个总结,简单的按照文件内容长度进行切片啊,有多长你就除以这个对应的这个切片的长度是32兆还是128兆啊等等啊。呃,切片大小默认等于块的大小啊。本地模式32兆啊。这个牙模式128兆。老的版本64兆。之后切片时不考虑数据集的整体,而是逐个针对每一个文件单独切片啊,这也要注意,它是针对独立文件单独切。再后来力分析。输入两个文件,再问一下这个怎么切,切成几片?怎样?
01:00
上面这一个写底片。三片是吧,那下面这个呢。一片是吧,OK。恭喜你,答对了。那是不是就四片啊?上面128。一百二十八二十六二十六到三百二之后零到十。四片,这就是他的一个机制哈。那再往下呢,是配置一下切片大小的参数啊。呃,原码中计算切片大小的公式是这个。啊,这个默认的它是。一这个呢?浪的最大值啊,浪的最大值啊,这个是。32兆哈,本地哈。那下面。呃,下面呢,是默认情况下切片大小等于块大小,那切片大小如何设置,这是一个问题啊。呃,这个max值如果将它参数调的比block小。
02:00
觉得他比他小。你这个原来是128兆,我现在呢调成100兆。来,那是不是就是选择它了啊,这个是默认是一,那最终是不是把这个块大小降下来了。啊,所以说你要把这个切片让它变小,那你就调大啊。那你要想把这个切片变大啊,变大怎么办呢?要把它变大是吧,比如说变大200兆。那这个呢不动啊,这个map啊,这个不动,那么它两个都不动的话,它最终胜出的是它它呢是128兆。那你这边是200兆数据选他了。呃,在企业开发中,除非你的这个机器哈,啊,非常非常好啊,那你这时候要要考量啊,基本上就会把这个呃,Mini size调成256兆啊。就调他哈,直接调他删除设置。
03:00
在哪里去设置知道吗。设这个配置文件啊,API也行啊,配置文件也行,是都能搞定它啊,这个参数三种方式吧,是不是一个是配置文件啊。代码是不是还有一个是在这个工程录下添一个这个参的文件也是OK的,哎,都可以啊,这个别忘了。好,那再往下获取切片信息的API。这个呢,是我们在后面在写代码的时候,会经常获取切片的信息啊。通过这个切片的信息,我们可以获取这个文件的。比如说刚才我们那些片把那个hello。Hello,第T。切片信息里面是不是就有这个名字啊,那我们通过这种方式可以反推回这个文件的名称以及它的路径。这个呢,是根据这个切片获取这个详细的这个界面信息。
04:00
默认的是file音步的啊,File state。是input审可的,我啊input的把它变成这个。Lead啊,这个后面会用,用的时候我们再来说它啊,现在不太说。这呢是fair input for啊,如何来配置它相应的参数啊?
我来说两句