00:00
大家好。欢迎大家继续收看上硅谷的云计算课程,这节课呢,我们来学习一下12编程中的字符处理页没,其实啊,这东西说白了就是排序,挑出剔除,重复行统计,这个要比前面讲的这些东西要简单的多啊。那我们看一下第一个命令sort排序,这个简单。那么直接sat后面加个页面就可以进行排序了,但是它默认是按你的开头的第一个字符来排,那这样的话来看我们排一下。日期C下的pass,那么我们能看到一开始的时候,我们系统默认是按照这个root排第一个对吧,然后呢,这个伪用户排往后排,然后普通用户往后最后排对吧?那我们这里可以看到它是按字母来排了。OK,那这是这个S排序,如果想取反呢,这个杠R就可以取反,哎,那也就说本来是从A到这个Z,那取反就反过来Z到A,那我们可以看到前面第一个先是V了U对吧?啊,因为我们最后是A对吧,这是按照字母排序那。
01:11
Salt呢,能不能指定我们的这个按照指定字段排序是可以的。杠七指定一下分割符杠K,杠K指定一下你从哪一个按第几个字段来排,那如果你就是按第三个字段,比如说我这里想干嘛,看着我这里是不是有他做的是不是有UID,我就想按照ID号来排,对吧?那所以我就是起始字段是三字段。终止字段也是三字段,说白了就是按第三个字段来排,那这个时候简单了,那我们怎么办?So-K问号分割符杠K,起始是三,终止是三排这个pass的这个文件对吧,那我们可以看。呃,看起来是执行了啊,行了,应该刚刚应该空了啊这啊,那我们可以看到0012往后排了,但是如果你仔细看好像不太对,为啥。
02:05
这里零一,然后变1011121350,这呃这个幺四对吧,但是这后面怎么还有个二了,各位还有个三啊,原因它没有把这个数字当成这个整整数按成按当成数一二三四六六七八九十这样排,它当成的是字符串来,所以啊,他先是排第一的字符串。那么这个第一个字串也是一,后面这个第后面这些字串看都是一,然后他才开始排第二个字串,看到了啊,开始开排第二个,第一个字符串都是一对吧,再排第二个字串,而他看这个二呢,他是认为第一个字符串比它大,换句话说就是他没有按照数字来排啊,没有按照数字来排序,它是按照字符串来排序,那这个不痛快啊,我们肯定不习惯啊,那怎么办?加个杠N,它就会按照这个。这个数字数值来进行排序了啊,那这个就合理了,那我们试试空两格。
03:04
要不然找都找不着。好,那我们这时候再开,我们就可以看到正常了,01234对吧,5673,这个三四,然后呃5678来往后排了,好这是排序啊,这个为啥要排序啊,你提取的时候有时候就是需要这样的,比如说成绩表啊,这些东西是不是都需要排序的ID号啊,对吧,所以还是有用的,其次由这个是取消重复行各位我们。这个作用啊,Self sortt里面有一个选项杠,U和unx的作用是一样的,就是如果有重复房,它只显示其中一盒就行了,这个也是有可能的要用的啊,把重复排除在外,这个命令在一些系统写的这个脚本当中经常见啊,那我们经常需要打一下把这个要重复行排掉啊,这个简单,我们现在pass的这个文件里没有重复行,可能看不到效果,那这个知道就行。WC我们前面用过了。
04:01
对吧,我们这里再简单说一下统计,呃,文件名,我们试试统计WC,然后日GC下帕缩,那它会发现有多少行,多少个单词,多少个字符,OK,那这个就是统计,那如果我要执行统计行号呢。统计行数呢,杠M,这就是统计行数杠W统计单词数杠M统计字符数啊这就这个,就这个很简单,WC我们前面都用过,好这两个,这三个命令是不是要比前面简单的多了多了对吧?好了,那这就是我们三个字,这个字符处理的,其实就是排序这个去除除复行统计这样三个病列好了,那这节课就是这样,我们下节课再见。
我来说两句