00:00
好,接下来呢,我们讲一下这个的工具啊。非常常用的几个工具,一个是看,一个是S和S这几个命令啊,呃,可以说是恒大各大学科啊。一个是大数据行业。啊问啊,Java的也问啊。相对少一些,还有什么问的?Passion。也问啊,所以说这几个命令是真的是非常非常重要的啊。那么来看一看吧,这几个命令。其实很简单啊,特别简单。来瞅一瞅。的工作。就是减。不是一剪梅是吧?具体来说呢,就是在文件中负责剪切数据用的。啊,从一大堆数据当中检出你核心关键的。你要。那看的命令呢?从文件的每一行剪切字节、字符、字段。并将这些字节、字段和。
01:03
制服只在输出。就这么一个作用,从一堆文件当中裁剪出你想要的。啊好,那我们来看一下啊。第一个呢是cut选项参数文件。名称,也就说你要看哪个文件,那看哪个文件中间的选项参数呢,就是怎么去看。怎么去减?那看一下吧,第一个呢是杠F。列号,你说从这一堆文件当中。你检出几例?取其中的第几列。那其他你像你这个这一行文字当中,你怎么切呢。杠地。分割符,急。默认的是制表符。那这个呢,后面其实我们常用的像这个制表符啊,像这个空格啊,啊,还有这个像这个分号啊,啊冒号啊等等都能写。
02:08
好,那这个是杠D和杠。对,刚说完你不练,你肯定是。那下面我来一个案例啊,来案例之前先准备一下数据啊。那是一个。第二第二季。进来。在这里面的输入。你得准备好了数据。这个回车啊,去掉啊,这是东莞。是深圳,我来。对吧,啊这么几个。那这个尺寸要注意什么呢?你看啊,这是不是一个空格。两个再来。是吧,啊注意啊,有的地方是一个有的两个那一会再切的时候啊。
03:05
其实不一样哈,要看你看啊。准备完数据之后开始切割的第一列。也就是说要把这一串数据的。这一列内容取出来。需求比较多哈,啊,把第一列取出来,那怎么取?首先是cut,要看哪一个文件,Cut的文件是cut.t这文件。那中间这一块是命令参数啊。全参数有两个,一个是杠D,一个是杠F。杠D呢是指定用什么切,默认是用杠T对吧?啊,那这里面是空格是。肯定得修改这个当地啊。那中间这个杠地就变成了。那取第一列,那就是杠F是不是取啊?去哪一列呢?去第一列。
04:01
一个是指定空格,一个是指定。那来吧,开始。这个。杠D是用采用什么去切对吧?切完之后取哪一列杠F。在第一列,那就是一。那对哪个文件呢,对这个。看一下啊。杠D空格啊。专门去切,去切。接完之后取出地列。走。东莞。神圣的地方就诞生了。
05:01
OK吧,这是取出第一列,再再往下看。切割cut的。然后第二列和第三列,也就是说获取第二列和第三列。这一点吧。那么再来呗,在这基础上获取第二列,第三列。山呢,加一个。我们来看一下吧。深圳网。对吧。他说,那你要只取第二列呢?就是中间这块空格啊。格这个是数据的啊,有规格,所以说呢,我这里取。二三,那就把。比较简单是吧,那再往下来。这个看文件当中切割出管子。
06:03
也就是说从这个文件当中。把这个管子。那么来来试一下啊。首先呢是CA。啊。先说这样能看到这个文件吧。看到他,然后。竖线啊,管弧直接什么命令呢。是过滤出以管开头的所有的这个行吗?是不是这一行就出来了,那这一行出来了,我要在这一行的基础上把管子获取到来。
07:04
看看。用什么切?各地就工行写就行了啊。空格切完之后,我要取出。第一列是吧啊。后面就不要这个cut了啊啊,不要这个卡了,因为前面已经有了。已经切到这儿了,你这一看就没了啊。啊。就管出来了啊,就刚才这个情况下,你不要再来一个啊。又回去了。啊,是这意思。像一级一级。过去啊。到了再来。呃,选取选取系统pass变量第二个冒号开始后的。所有的东西。
08:02
这是获取获取心动的变量的值啊,Pass值,那现在这里要求什么呢?第二个冒号。也是这个。冒号开始后。所有路径。这个冒号后的啊,表示的就是这个号。留着这些内容,前面的内容删掉。那你要第二个那也行,那就从这开始。开始切,就取出后面的值。你是不是还得切?首先拿到它对吧,啊,然后它是获取到这个值,然后之后要切看。用什么解?而且啊。那然后取第几个。嗯,那要是从这开始往后的话,那就是一个两个就第三列之后啊。
09:03
第三列之后是。你要你不加那个杠,是不是表示第三列加个杠表示三第三列之后所有的。从这开始啊。对吧,啊,开始后面这个所有的嘛。先获取到这个值,然后看,那问大家问题,那我这么看了,完了之后,它这个值有没有改变呢。你没有改变原文件。啊,没有啊,没有改文件记录。并没有改变链接你看啊。叔叔。原软件并并没有改变,只是我把那个值迁移出来之后打印到控制台上,我现在是打印到控制台上,那你说未来我是不是可以再把它输到另一个文件。直接追加到其他文件里面。那这个呢,就。
10:02
那再来。呃,切割这个。这里面有一个IP地址幺九二点幺六八点幺点。在这儿就切他。这种非常常用啊,现在呢是切的这个啊,在你们日后的这个项目开发中切什么呢?你有大量的日志。啊,日志文件,日志文件里面其中就有一列,有可能是IP。大部分都有,那这个IP地址的访问的日志,你给我切出来。
11:07
一不看这个啊,一天是那个。是不是一下就干到一半了?我要不干这样,我要是直接这个过滤的话,这里面有个什么问题呢。对,他下面我记得还有IP了。特尔,我要是动这一行的话,那这两行都有了。我得两啊,所以说我先过滤一下,让他过滤一下。过滤到。之后呢,我再以他开导。再过滤GRP。冒号、引号。带的啊。获取这一块的。我来看一看是不是。最后到他了。获取到他之后,我还要切。
12:01
我是不是用冒号一切切完之后是不是又切成好几段啊。啊,当然有些同学说我用这个正式切行不?行一样行对吧,啊一样的啊都行,那我这里面呢,我产生的是用他写。啊,这种切法有很多种了啊。我们来切一下。在他基础上。然后是cut。看的什么呢?用什么切呢?啥啊?符号切切完之后我取第几个呢?第二个对吧,第二个。下到这了。到这是我们想要的吗?依然不是。那继续用什么写?线看看。啊。空格,然后。杠F级。终于。
13:00
就从这么一大堆这个内容当中切割出我们想要的IP地址。这种在日常的企业开发中。偏多的啊,几乎。这个就是这个卡。
我来说两句