以后这个系列的每次就浓缩一下只推送一个命令~
sort
sort命令是帮我们依据不同的数据类型进行排序,在Linux里非常常用的一个命令
sort命令使用介绍: 命令格式:sort [-bcfMnrtk][源文件][-o 输出文件]
命令功能:依据不同的数据类型进行排序
命令的常用参数选项说明:
-b 忽略每行前面开始出的空格字符
-c 检查文件是否已经按照顺序排序 -f 排序时,忽略大小写字母 -M 将前面3个字母依照月份的缩写进行排序 -n 依照数值的大小排序 -o<输出文件> 将排序后的结果存入指定的文件 -r 以相反的顺序来排序 -t<分隔字符> 指定排序时所用的栏位分隔字符 -k 选择以哪个区间进行排序
-C 会检查文件是否已排好序,如果乱序,不输出内容,仅返回1
-M 会以月份来排序,比如JAN小于FEB等等
一般常用的情景是
1
比如我们有一个几百兆的数据集,里面有很多的单词,我们要分析这些单词的,但是为了好看,我们可以用sort来把这些杂乱的单词归类
[ubuntu@test]$ cat seq.txt banana apple pear orange [ubuntu@test]$ sort seq.txt apple banana orange pear
这是个简单的例子
2
还有个重要的用途就是消除文本中的重复行,我们这里有两个pear
[ubuntu@test]$ cat seq.txt banana apple pear orange pear [ubuntu@test]$ sort -u seq.txt apple banana orange pear
3
sort一般默认的是升序排序,如果想把一个文件变成降序排序,可以这样
[ubuntu@test]$ cat number.txt 1 3 5 2 4 [ubuntu@test]$ sort -r number.txt 5 4 3 2 1
4
由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件
形如
sort oldfile > newfile
但是,如果你想把排序结果输出到原文件中,用重定向可就不行了
但是我们有-o选项
[ubuntu@test]$ cat number.txt 1 3 5 2 4 [ubuntu@test]$ sort -r number.txt -o number.txt [ubuntu@test]$ cat number.txt 5 4 3 2 1
5
如果你打算按照数值来排列数字而不是按照ASCII来的话,可以用-n选项
默认的sort是这样排序的,先比较第一个字符,然后安装第一个字符的大小来排序,之后再对第一个字符相同的集合按第二个字符排列,这样一直到字符串的结尾
如果我们加了-n就可以拜托这个默认的排序方式了
[ubuntu@test]$ cat number.txt 1 10 19 11 2 5 [ubuntu@test]$ sort number.txt 1 10 11 19 2 5 [ubuntu@test]$ sort -n number.txt 1 2 5 10 11 19
6
如果你的文件很复杂,并不是都是数字的文件,比如这样的
[ubuntu@test]$ cat sort.txt banana:30:5.5 apple:10:2.5 pear:90:2.3 orange:20:3.4
这里我们可以注意到数字都是跟在一个:后面的,我们就可以这样了
[ubuntu@test]$ sort -n -k 2 -t : sort.txt apple:10:2.5 orange:20:3.4 banana:30:5.5 pear:90:2.3
这里的-n是按照数值排列,-k是指定第二列的数据,-t是指定分割的字符是: