使用awk根据多列向外连接两个csv文件，同时保持第一个文件观察值的顺序

，可以通过以下步骤实现：

首先，确保你已经安装了awk工具。在大多数Linux和Unix系统中，awk是默认安装的。如果你使用的是Windows系统，你可以通过安装Cygwin或者使用Windows Subsystem for Linux来获取awk。
创建一个名为join.awk的文本文件，并将以下代码复制到文件中：

BEGIN {
    FS = ","
    OFS = ","
}

NR == FNR {
    key = $1 FS $2
    file1[key] = $0
    next
}

{
    key = $1 FS $2
    if (key in file1) {
        print file1[key], $0
        delete file1[key]
    }
}

END {
    for (key in file1) {
        print file1[key]
    }
}

将第一个csv文件命名为file1.csv，第二个csv文件命名为file2.csv，并将它们与join.awk文件放在同一个目录下。
打开终端或命令提示符，进入到包含这些文件的目录。
运行以下命令：

awk -f join.awk file1.csv file2.csv > output.csv

这将会将连接结果输出到名为output.csv的文件中。

解释：

第1行：设置输入和输出字段分隔符为逗号。
第3行：当处理第一个文件时（NR == FNR），将第一个文件的第1列和第2列作为键，将整行保存到file1数组中。
第7行：当处理第二个文件时，如果当前行的第1列和第2列在file1数组中存在，则打印第一个文件中对应的行和当前行，并从file1数组中删除该键。
第12行：在处理完第二个文件后，打印file1数组中剩余的行，即第一个文件中没有匹配的行。

这样，你就可以使用awk根据多列向外连接两个csv文件，并保持第一个文件观察值的顺序。

页面内容是否对你有帮助？

有帮助

没帮助

使用awk根据多列向外连接两个csv文件，同时保持第一个文件观察值的顺序

、、

我有两个csv文件。,Lily,F,200,8590,Jim,288,Lily,1 85,Lily,0 我想要做的是在保持文件1的观测顺序的同时，基于道布和名称将文件2左外部联接到文件1中。所以我想知道我是否可以使用awk

浏览 22提问于2019-10-01得票数 0

回答已采纳

3回答

将大的gz文件拆分成较小的文件，过滤和分发内容

、、

我有一个大小为81G的gzip文件，解压后的文件大小为254G。我想实现一个bash脚本，该脚本获取gzip文件并在第一列的基础上将其拆分。第一列的值范围在1-10之间。我想将文件分成10个子文件，其中第一列中值为1的所有行放入一个文件中。将第一列中值为2的所有行放入第二个文件</em

浏览 109提问于2020-12-20得票数 1

3回答

使用不同列中的不同信息提取行

、

我有一个包含不同信息的大数据文件。我只需要在另一个文件中选择和复制该文件的一些行。共有2543行22列。BTB我需要使用第3、第5和第6列中<e

浏览 0提问于2021-03-10得票数 3

回答已采纳

3回答

使用awk或perl按键对文件进行排序，就像没有预置的联接一样。

、、、

我想连接两个选项卡分开的文件，但它们的顺序不同。我知道用awk是可行的，但我不知道怎么做。({'VAL1' :[0,1,2,3,4,5,6]}) 我有两个文件:

浏览 17提问于2017-07-05得票数 2

回答已采纳

2回答

两个文件与第一列匹配文本和第一文件第二列>第二列值的比较

、、

寻找一只锥一衬垫：我需要打印两个文件中第一个列匹配的记录，以及第二个文件值列>大于第一个文件值列的记录。file1BBBB 322file2CCCC 400寻找结果 AAAA

浏览 7提问于2015-06-04得票数 1

回答已采纳

3回答

如何使用shell脚本连接2个csv文件？

、、

我正在尝试创建一个shell脚本，它将以以下方式组合两个csv文件：startId, endId, roomNumstartId, endId, teacherId 我想将这两个文件合并成一个csv文件，格式

浏览 3提问于2011-06-10得票数 5

1回答

根据每个非空的第一列中的字符串将行提取到单独的文件中。

、

我有一个csv mappings.csv如下所示。我想将一组记录提取到与每个具有非空第一个字段的记录相关的单独文件中。这些文件显示在mappings.csv之后。,cc$ cat TEST3.csv,,,bbb,bbb,bbb,bbb 我可以使用awk打印具有非空第一个字段的行，但无

浏览 0提问于2021-08-02得票数 1

回答已采纳

2回答

基于一列在文件中查找公共行

、、

我有15个文件a,cq1,10,0,0,0,0... file2.csv文件15.csv s,cw1,0,0,7,0,0...我在每个文件中有不同的行数，我想比较所有15个文件的第二个字段，并提取

浏览 3提问于2012-05-21得票数 1

回答已采纳

1回答

awk:多个CSV文件中多列数据的数学操作

、、

我正在编写bash脚本，它循环多列数据填充并执行集成的AWK代码来操作多列数据。简单地说，工作流应该处理位于${d}文件夹中的input.csv的每一行，该文件夹已被bash脚本正确标识： # input.csv located in脚本将处理每个CSV文件的每一行，以便将它们缩减为

浏览 7提问于2021-05-11得票数 2

回答已采纳

1回答

、

我有一份文件是这样的：3 b9 a5 c我想..。仅打印列2中每个元素的最后一个实例，并在第1栏中打印相应的值；将标签更换为回车；所以最后的输出应该是这样的</e

浏览 5提问于2012-09-03得票数 0

7回答

使用上一列，使用awk按字母顺序排序

、、

我试图排序一个可变数量的文本列，有时有3个字段，有时有2个。 George W.Kennedy Brack Obama到目前为止，我已经把每一行都翻到前面了。我尝试了数组，得到了比预期(重复)更多的输出。我只想把这个作为一个awk文件保存。我考虑过使用另一个awk文件将

浏览 0提问于2017-09-26得票数 2

回答已采纳

2回答

通过awk合并具有N个公共列的多个文件，如果任何文件没有公用键，则希望将列值替换为0

、、

我希望根据公共列合并多个文件，并希望在任何文件都没有该公共列时添加0。，第4列的值是不同的，我想按顺序排列。和1.txt一样，输出文件中的值应该是第4列。6th值应位于输出文件的第5列，而a3.txt的值应位于输出文件<e

浏览 0提问于2022-08-02得票数 2

回答已采纳

3回答

根据第二列值拆分CSV文件

、

我正在使用Ubuntu，我想根据第二列(年龄)中的值将我的csv文件分割成两个csv文件。60岁以下患者(<60)的第一个档案和60岁以上的病人(>=)的第二个档案。例如，如果我有以下输入：1,653,55,78file_under： id,

浏览 0提问于2023-04-05得票数 7

1回答

按一列合并两个文件- awk

、、

我有两个不同的脚本通过一个匹配的列合并文件。文件1.tsv-4列，用制表符分隔2 OLD c.11A+1>R p.Ill1639Los 3 SRP c.96V-T>X p.Zub%D23Ouptut.tsv -所有来自file2.tsv的列和file1第一列后面的所有列(如果匹配)。LAK "empty_col

浏览 2提问于2018-08-28得票数 0

回答已采纳

1回答

如何读取逗号分隔值

、

我们有一个固定宽度的文件Col2 length 10Col4 length 40ABC 123 xyzXxy. 81651-61761如果该值为1，则输出文件中不会发生任何更改。如果存在多个值，即逗号分隔(5171-5261,51617)，则输出文件应具有多条记录。 1 re

浏览 0提问于2017-10-14得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用awk根据多列向外连接两个csv文件，同时保持第一个文件观察值的顺序

相关·内容

使用awk根据多列向外连接两个csv文件，同时保持第一个文件观察值的顺序

将大的gz文件拆分成较小的文件，过滤和分发内容

使用不同列中的不同信息提取行

使用awk或perl按键对文件进行排序，就像没有预置的联接一样。

两个文件与第一列匹配文本和第一文件第二列>第二列值的比较

如何使用shell脚本连接2个csv文件？

根据每个非空的第一列中的字符串将行提取到单独的文件中。

基于一列在文件中查找公共行

awk:多个CSV文件中多列数据的数学操作

Linux中有没有基于多列进行模糊匹配的命令

在另一个awk命令中使用一个awk输出

( 1)根据另一个文件头重新排序一个csv文件；( 2)将一个csv文件的一列合并到另一个csv文件中，并删除重复

根据一个公共的第一列合并两个两列文件，首选来自给定文件的第二列的值。

查找2个csv文件差异的有效方法

按字母表顺序在awk中排序数组

使用上一列，使用awk按字母顺序排序

通过awk合并具有N个公共列的多个文件，如果任何文件没有公用键，则希望将列值替换为0

根据第二列值拆分CSV文件

按一列合并两个文件- awk

如何读取逗号分隔值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐