linux 命令 uniq

uniq 是 Linux 系统中的一个命令行工具，用于报告或过滤文件中的重复行。它通常与 sort 命令结合使用，因为 uniq 只能检测相邻的重复行。

基础概念

uniq 命令的基本语法如下：

uniq [OPTION]... [INPUT [OUTPUT]]

INPUT 是输入文件，默认为标准输入。
OUTPUT 是输出文件，默认为标准输出。

类型与应用场景

常用选项

-c 或 --count：显示每行重复出现的次数。
-d 或 --repeated：仅显示重复出现的行。
-f N 或 --skip-fields=N：忽略前 N 个字段。
-s N 或 --skip-chars=N：忽略前 N 个字符。
-u 或 --unique：仅显示唯一的行。

应用场景

日志文件去重：在分析日志文件时，去除重复的错误信息。
数据清洗：在数据处理过程中，删除重复的数据记录。
统计分析：统计某列数据的出现频率。

示例代码

假设我们有一个名为 data.txt 的文件，内容如下：

apple
banana
apple
orange
banana

去除相邻重复行

sort data.txt | uniq

输出：

apple
banana
orange

统计每行的出现次数

sort data.txt | uniq -c

输出：

  2 apple
  2 banana
  1 orange

仅显示重复的行

sort data.txt | uniq -d

输出：

apple
banana

忽略前两个字符进行去重

sort data.txt | uniq -f 2

假设文件内容变为：

a1pple
b1anana
a2pple
o1range
b2anana

输出：

a1pple
b1anana
o1range

遇到的问题及解决方法

问题：为什么 `uniq` 没有按预期去除重复行？

原因：uniq 只能检测相邻的重复行。如果文件中的重复行不是相邻的，uniq 将无法正确识别。

解决方法：在使用 uniq 之前，先对文件进行排序。

sort data.txt | uniq

问题：如何忽略特定字段进行去重？

解决方法：使用 -f 或 --skip-fields 选项指定要忽略的字段数。

sort data.txt | uniq -f 1

假设文件内容变为：

apple,fruit
banana,fruit
apple,fruit
orange,fruit
banana,fruit

输出：

apple,fruit
banana,fruit
orange,fruit

通过这些示例和解释，希望能帮助你更好地理解和使用 uniq 命令。

页面内容是否对你有帮助？

有帮助

没帮助

只使用AWK而不使用其他命令(如uniq )来计数字段数

样本文件a bc d本例中有2个字段和3个记录。wolf@linux:~$ awk '{print NF}' file.txt 2wolf@linux:~$ 要获得唯一的数字，需要使用uniq命令。wolf@linux:~$ awk '{print NF}' file.txt | un

浏览 0提问于2021-01-29得票数 -2

回答已采纳

1回答

重定向linux* uniq命令出错*

、、、、

我刚开始学习Linux，遇到了一个有趣的问题。123 当我使用uniq 1.txt时，它会发出1 2 3。为此，我使用了以下命令：uniq 1.txt > 1.txt。但是最后它显示了1.txt文件完全是空的。有人能帮我了解一下发生了什么吗？

浏览 3提问于2019-09-23得票数 0

回答已采纳

2回答

总结LINUX中的uniq计数

我在Linux shell中有包含以下详细信息的文件jhon , bananajhon , bananajhon ,bananaSam , apple使用我的Linux命令，我可以得到如下结果结果

浏览 3提问于2017-11-28得票数 0

回答已采纳

1回答

Linux中的Uniq命令无法正常工作

、、

我是Linux的新手，当我试图理解uinq命令时，我遇到了这个问题，我使用cat命令创建了一个文件hello2，并在其中输入了以下文本google sort hello2 | uniq google hello google hello

浏览 1提问于2020-10-14得票数 0

4回答

在哪里可以找到Unix实用程序的源代码？

、

有没有人能给我提供linux命令源代码的指针，比如'sort‘，'uniq’等？

浏览 1提问于2009-06-25得票数 31

回答已采纳

1回答

使用Linux/UNIX命令，我计算了文件中的数字唯一日期。命令uniq -c返回文件中每个唯一日期的出现次数。是否可以使用uniq -c返回的值进行算术操作，或者是否有其他方法来计数发生和进行算术操作？下面是我的Linux逗号： grep -E [0-9][0-9]/[A-Z]{1}[a-z]{2}/[0-9]{4} log.txt | sed 's/.*$..$\/Oct\/$....$.*/\2

浏览 0提问于2018-10-09得票数 0

回答已采纳

3回答

获得重复行和文件的其余部分[大文件50G]

、

我有一个大文件50G，我想得到文件的重复行和其余部分，我使用两个命令来获得结果，这需要很长时间。sort file.tsv | uniq -d > duplicateList.tsv 由于您可以看到这个过程重复了两次，所以我希望只执行一个命令，并返回这两个结果，而不使用重复的命令。注意:我可以使用linux命令或Python脚本。

浏览 5提问于2021-10-22得票数 4

2回答

perl linux命令不起作用

、

cat t.incopt.02.20110221 | awk -F, '{print $1}' | sort | uniq但是如果我插入到perl中，如果我打印上面的数组vari，我得到了整个文件内容，我猜当我在perl内部使用时，linux命令不能正常工作，

浏览 2提问于2011-02-23得票数 0

回答已采纳

7回答

在文件中查找重复的行，并计算每行被复制的次数？

、、、、

假设我有一个类似于以下内容的文件：123 234 345123 3 345 1

浏览 1提问于2011-07-16得票数 624

回答已采纳

3回答

awk打印线问题

、、

我现在遇到了awk命令的一些问题。最初的脚本是使用awk在MacOS上开发的，然后移植到Linux上。在那里，awk显示了一种不同的行为。我要做的是统计通过/tmp/test.uniq.txt在文件/tmp/test.txt中提供的单个字符串的出现情况。awk '{print $1, system("cat /tmp/test.txt | grep -o -c " $1)}' /tmp/test.uniq

浏览 1提问于2018-06-27得票数 1

回答已采纳

1回答

在linux中使用带有排序的uniq命令与不使用uniq命令的区别

、、、、

当我使用uniq -u data.txt列出整个文件时，当我使用sort data.txt | uniq -u时，它省略了重复的行。为什么会发生这种事？uniq man说-u，--唯一只会打印出独特的线条。我不明白为什么我需要用管道来获得正确的输出。

浏览 2提问于2020-06-14得票数 1

回答已采纳

3回答

cat管道awk操作与文件上awk命令的比较

、、、

在试图优化我的服务器相关数据时，我和我的团队讨论了linux命令的使用问题。请各位议员帮助我们更准确地理解这个概念。简单的逻辑是对特定字段(使用分隔符)进行排序，并使用uniq -c命令来计数此类实例的数量。我可以看到两种方式来实现它：和 awk -F":" {'print $1'} fname | sort| u

浏览 12提问于2015-03-30得票数 2

回答已采纳

5回答

使用Linux命令比较文件

、

哪个Linux命令允许我检查文件A中的所有行是否都存在于文件B中？(它几乎就像一个diff，但不完全是)。同样，文件A也有uniq行，文件B也是如此。

浏览 0提问于2010-12-16得票数 3

回答已采纳

2回答

如何使用linux命令行工具列出文本文件中使用的唯一字符？

、、、

我想列出使用linux命令行工具在文本文件中使用的一组字符。我怎样才能做到这一点？ uniq实用程序只在线路上工作。

浏览 1提问于2014-04-22得票数 10

2回答

需要帮助创建Linux脚本

、、、

是否有一种方法可以在linux (或Windows)脚本中执行此操作，可能使用的是if this语句？

浏览 3提问于2013-10-21得票数 1

回答已采纳

3回答

在两个文本文件中找到相似的行？

、

我有两个排序好的文本文件，里面填满了python模块和版本号。格式如下：DataShape==0.3.0Jinja2==2.7.3PIL==1.1.7我知道这会带给我他们的共同之处但我也想知道它们有什么共同之处，即使版本号不同。有什么简单的方法可以做到这一点吗？

浏览 2提问于2016-06-22得票数 1

4回答

Python类似的uniq* -c命令？*

、、、

python是否有一个类似于linux命令的命令：在其中，它排序并计算每个新行上带有整数的文本文件的频率，并将以以下形式输出： 15 22 7 24 如果没有，我可以简单地使用os.system(cat file.txt | sort -n | uniq

浏览 2提问于2014-06-24得票数 2

回答已采纳

2回答

为什么这两个命令会有区别

、

我试图过滤掉一些东西，并使用一个有两个不同之处的长linux命令。在第一种情况下，我使用了在第二种情况下，我使用了没有排序的我想知道为什么行数会有差异

浏览 0提问于2013-08-02得票数 1

2回答

如何找到每个文本的实例数？

、

所以我有一个很大的文件，它在一个由城市组成的列中。我想要写一个程序，它将找到每个城市的实例总数，并将其显示在一个新文件中。我该怎么做呢。如果文件是这样的Manhattan Manhattan ChennaiCityCork 1 Chennai 2

浏览 0提问于2019-08-06得票数 0

1回答

基于另一列获取excel中列计数的powershell命令。

、

我希望计数是基于另一列使用powershell的列。示例：x az ba a我想知道每个组有多少个名字(计数)。powershell中是否有不使用foreach循环的进程？

浏览 2提问于2022-10-11得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

linux 命令 uniq

基础概念

相关优势

类型与应用场景

常用选项

应用场景

示例代码

去除相邻重复行

统计每行的出现次数

仅显示重复的行

忽略前两个字符进行去重

遇到的问题及解决方法

问题：为什么 uniq 没有按预期去除重复行？

问题：如何忽略特定字段进行去重？

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问题：为什么 `uniq` 没有按预期去除重复行？