我有一个模块,我现在被卡住了。我想在这件事上寻求你的帮助。
假设我有一个包含以下条目的文件:
ABC 123 ... <--基于第1列值的第一次出现
CDE 456 ...
定义234 ...
ABC 234... <--基于第1列值的第二次出现
和另一个包含以下条目的文件:
<-- missing 1st occurence
CDE 234...
定义456 ...
ABC 346 ... <--基于第1列值的第二次出现
目前,我需要比较这两个文件,并提出了一个输出,说明第二个文件中缺少第2个实例。任务的第一阶段已经完成(我不确定这是否是正确的处理方式)。首先,我根据第一列的值对两个文件进行了排序,然后使用"sdiff -s“来比较两个排序后的文件。我使用这种方法的限制是“排序文件”只包含数据列1。
例如:
ABC
ABC
CDE
定义
这给了我想要的结果。但问题是,我找不出第二个文件中遗漏了ABC的哪个实例。如果我根据"sdiff -s“的结果在第一个文件上使用"grep”,它会给我两个值。
有人能对此发表一些见解吗?
谢谢。
发布于 2013-08-04 22:59:51
怎么样
sdiff -s <(cut -d' ' -f1 file1) <(cut -d' ' -f1 file2)
(我想,您需要bash版本的4+才能使流程重定向工作)
https://stackoverflow.com/questions/18030241
复制相似问题