两个大文件,a.txt和b.txt两个文件的数据都是逐行呈现的, 如何求他们的交集、并集和差集。
用sort+uniq直接搞定:
1 2 3 | $ sort a.txt | uniq > aa.txt $ sort b.txt | uniq > bb.txt $ cat aa.txt bb.txt | sort | uniq -d |
---|
1 | cat a.txt b.txt | sort | uniq |
---|
1 2 3 | $ sort a.txt | uniq > aa.txt $ sort b.txt | uniq > bb.txt $ cat aa.txt bb.txt bb.txt | sort | uniq -u |
---|