linux 文件取交集、并集

(1)两个文件的交集,并集 前提条件:每个文件中不得有重复行 1. 取出两个文件的并集(重复的行只保留一份) cat file1 file2 | sort | uniq > file3 2. 取出两个文件的交集(只留下同时存在于两个文件中的文件) cat file1 file2 | sort | uniq -d > file3 3. 删除交集,留下其他的行 cat file1 file2 | sort | uniq -u > file3 (2)两个文件合并 一个文件在上,一个文件在下 cat file1 file2 > file3 一个文件在左,一个文件在右 paste file1 file2 > file3 (3)一个文件去掉重复的行 sort file |uniq 注意:重复的多行记为一行,也就是说这些重复的行还在,只是全部省略为一行! sort file |uniq –u 上面的命令可以把重复的行全部去掉,也就是文件中的非重复行!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏轻量级微服务

微服务下跨语言 RPC 实现

目前主流的 Java 开发框架 Spring Boot,为了更方便集成 gRPC,自己开发了 spring-boot-starter-grpc,仅需简单的几行配...

31530
来自专栏java、Spring、技术分享

JVM监控及诊断工具

jstat用法 其中-gc可以换成-class 、-gcnew、-gcold等参数;而54992表示的JVM的进程id(可能通过上面的jps命令查看...

58320
来自专栏应兆康的专栏

Python Web - Flask笔记2

导入config.py后app.config.from_object(config)

43120
来自专栏Java编程技术

白话网络通讯

无论你是纯socket通讯,还是应用层的http,Rpc协议进行通讯,本质底层都是传输二进制流

9410
来自专栏Python绿色通道

Python的进程

Python实现多进程的方式主要有两种:一种方法是使用os模块中的fork方法; 另一种是使用multiprocessing模块。这两种方法的区别在于前者仅适用...

14720
来自专栏我爱编程

Day15进程和线程

多进程 multiprocessing multiprocessing模块提供了一个Process类来代表一个进程对象,下面的例子演示了启动一个子进程并等待其结...

30050
来自专栏Core Net

ASP.NET Core 2.0 : 七.一张图看透启动背后的秘密

37850
来自专栏Golang语言社区

Golang语言社区-文件操作

Golang语言社区-文件操作 go语言支持的文件操作很多 1、传统的文件操作 导入文件操作需要的包 import "os" 1、文件的打开 f := os...

36860
来自专栏程序员的知识天地

Python使用os模块、Try语句、pathlib模块判断文件是否存在

通常在读写文件之前,需要判断文件或目录是否存在,不然某些处理方法可能会使程序出错。所以最好在做任何操作之前,先判断文件是否存在。

22420
来自专栏FreeBuf

Weevely命令传输分析

前言 Weevely是一款使用python编写的webshell工具,集webshell生成和连接于一身,可以算作是linux下的一款菜刀替代工具(限于php)...

33090

扫码关注云+社区

领取腾讯云代金券