Hacker基础之Linux篇:基础Linux命令六

以后这个系列的每次就浓缩一下只推送一个命令~

sort

sort命令是帮我们依据不同的数据类型进行排序,在Linux里非常常用的一个命令

sort命令使用介绍: 命令格式:sort [-bcfMnrtk][源文件][-o 输出文件]

命令功能:依据不同的数据类型进行排序

命令的常用参数选项说明:

-b 忽略每行前面开始出的空格字符

-c 检查文件是否已经按照顺序排序 -f 排序时,忽略大小写字母 -M 将前面3个字母依照月份的缩写进行排序 -n 依照数值的大小排序 -o<输出文件> 将排序后的结果存入指定的文件 -r 以相反的顺序来排序 -t<分隔字符> 指定排序时所用的栏位分隔字符 -k 选择以哪个区间进行排序

-C 会检查文件是否已排好序,如果乱序,不输出内容,仅返回1

-M 会以月份来排序,比如JAN小于FEB等等

一般常用的情景是

1

比如我们有一个几百兆的数据集,里面有很多的单词,我们要分析这些单词的,但是为了好看,我们可以用sort来把这些杂乱的单词归类

[ubuntu@test]$ cat seq.txt banana apple pear orange [ubuntu@test]$ sort seq.txt apple banana orange pear

这是个简单的例子

2

还有个重要的用途就是消除文本中的重复行,我们这里有两个pear

[ubuntu@test]$ cat seq.txt banana apple pear orange pear [ubuntu@test]$ sort -u seq.txt apple banana orange pear

3

sort一般默认的是升序排序,如果想把一个文件变成降序排序,可以这样

[ubuntu@test]$ cat number.txt 1 3 5 2 4 [ubuntu@test]$ sort -r number.txt 5 4 3 2 1

4

由于sort默认是把结果输出到标准输出,也就是屏幕,所以需要用重定向才能将结果写入文件

形如

sort oldfile > newfile

但是,如果你想把排序结果输出到原文件中,用重定向可就不行了

但是我们有-o选项

[ubuntu@test]$ cat number.txt 1 3 5 2 4 [ubuntu@test]$ sort -r number.txt -o number.txt [ubuntu@test]$ cat number.txt 5 4 3 2 1

5

如果你打算按照数值来排列数字而不是按照ASCII来的话,可以用-n选项

默认的sort是这样排序的,先比较第一个字符,然后安装第一个字符的大小来排序,之后再对第一个字符相同的集合按第二个字符排列,这样一直到字符串的结尾

如果我们加了-n就可以拜托这个默认的排序方式了

[ubuntu@test]$ cat number.txt 1 10 19 11 2 5 [ubuntu@test]$ sort number.txt 1 10 11 19 2 5 [ubuntu@test]$ sort -n number.txt 1 2 5 10 11 19

6

如果你的文件很复杂,并不是都是数字的文件,比如这样的

[ubuntu@test]$ cat sort.txt banana:30:5.5 apple:10:2.5 pear:90:2.3 orange:20:3.4

这里我们可以注意到数字都是跟在一个:后面的,我们就可以这样了

[ubuntu@test]$ sort -n -k 2 -t : sort.txt apple:10:2.5 orange:20:3.4 banana:30:5.5 pear:90:2.3

这里的-n是按照数值排列,-k是指定第二列的数据,-t是指定分割的字符是:

原文发布于微信公众号 - 玄魂工作室(xuanhun521)

原文发表时间:2018-04-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据

在Python中什么时候用Yield什么时候用Return

许多Python开发人员在代码中使用yield,而不考虑他们是否真的需要。这篇文章解释了你什么时候应该使用它。

3450
来自专栏Java爬坑系列

【Java入门提高篇】Day11 Java代理——JDK动态代理

  今天来看看Java的另一种代理方式——JDK动态代理   我们之前所介绍的代理方式叫静态代理,也就是静态的生成代理对象,而动态代理则是在运行时创建代理对象。...

2037
来自专栏LinkedBear的个人空间

唠唠SE的面向对象-06——单例模式 原

我们让之前写的Arrays工具类变成非静态的,但又只能保证有且只有一个Arrays的对象

763
来自专栏ml

C与C++在const用法上的区别

       首先,C和C++在大体结构上不同,却在语法上相同。  所以在使用的时候,我们会时常遇到一些莫名其妙的问题,觉得语法上是正确的,但是编译的时候却出现...

3214
来自专栏coding for love

JS入门难点解析8-作用域,作用域链,执行上下文,执行上下文栈等分析

(注1:如果有问题欢迎留言探讨,一起学习!转载请注明出处,喜欢可以点个赞哦!) (注2:更多内容请查看我的目录。)

881
来自专栏程序员互动联盟

【答疑解惑第三十一讲】如何使用全局变量?

疑惑一 全局变量如何用? ? 看图中的箭头的地方,声明全局变量的时候使用了static,这个问题就涉及到了static的使用,如果要使用全局变量,并且在多文件中...

3479
来自专栏swag code

Java中的private、protected、public和default的区别(详解)

(1)对于public修饰符,它具有最大的访问权限,可以访问任何一个在CLASSPATH下的类、接口、异常等。它往往用于对外的情况,也就是对象或类对外的一种接口...

783
来自专栏听Allen瞎扯淡

一起 Static 和 Synchronized 引发的血案

这两天在定位一个网上问题的时候发现一个很诡异的现象,系统夜间的汇总任务跑了很长一段时间才能结束,而且日志显示这些汇总任务的每个子任务都很快就结束了,但整体任务还...

4822
来自专栏Python攻城狮

Python-time模块一、python time模块的简介 二、python time模块函数

注意:时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.tim...

923
来自专栏C/C++基础

C++ new的三种面貌

C++中使用new运算符产生一个存在于Heap(堆)上对象时,实际上调用了operator new()函数和placement new()函数。在使用new创建...

981

扫码关注云+社区